前言: 1、WikipediaSearch。一部大众百科全书应该运行在开源软件上,并且具有一个由Java驱动的搜索引擎,这是再合适不过的
1、WikipediaSearch。一部大众百科全书应该运行在开源软件上,并且具有一个由Java驱动的搜索引擎,这是再合适不过的了。Lucene是由DougCutting于1999年编写,并以他妻子的中间名命名的,它实际上是Cutting开发的第五个搜索引擎。他作为工程师先后为XeroxPARC(施乐帕克研究中心)、Apple和Excite创建了其他的引擎。2014年,Wikipedia用Elasticsearch代替了Lucene引擎,Elasticsearch是一个分布式的、支持REST的搜索引擎,也是用Java编写的。
2、Hadoop。Lucene并不是唯一一个进入我们这个榜单的Cutting创建的作品。2003年,Google在一篇研究论文中描述了在大型商用计算机集群上处理数据的MapReduce算法,受该论文的启发,Cutting用Java编写了一个MapReduce操作开源框架,并以他儿子的玩具大象命名,称为Hadoop。Hadoop1.0于2006年发布,催生了大数据趋势,并激发了许多公司开始收集“数据湖”(datalakes),制定挖掘“数据排放”(dataexhaust)的策略,并将数据描述为“新石油”(thenewoil)。到2008年,Yahoo(当时的Cutting曾在该公司工作)宣称他们的SearchWebmap运行在10,000个内核的Linux群集上,是现有的最大的产线Hadoop应用程序。到2012年,Facebook声称在全球最大的Hadoop集群上拥有超过100PB的数据。
3、并行图形分析(ParallelGraphAnalytiX,PGX)。图形分析是有关理解数据中的关系和连接的。根据基准测试,PGX是世界上速度最快的图形分析引擎之一。PGX是用Java编写的,由OracleLabs研究员SungpackHong领导的团队于2014年首次发布,PGX允许用户加载图形数据并运行分析算法,比如,社区发现(CommunityDetection)、聚类、路径查找、页面排名、影响因素分析、异常检测、路径分析和模式匹配等算法。在健康、安全、零售和金融领域,它的用例比比皆是。
4、H2O.ai。机器学习(ML)的曲线非常陡峭,这可能会阻止领域专家实现伟大的ML想法。自动化ML(AutoML)可以通过推断ML流程中的某些步骤(例如特征工程、模型训练和调整以及转译等)来提供一些帮助。由Java冠军CliffClick创建的基于Java的开源H2O.ai平台,旨在实现AI的大众化,并能为那些刚入门的人们充当虚拟数据科学家,同时能帮助ML专家提高效率。
免责声明:内容来源于公开网络,若涉及侵权联系尽快删除!
文章出自:http://qh.itpxw.cn/peixun/software/202191287.html
文章标题:关于Java应用程序数据的强度
免责声明:本站文章均由入驻起航学习网的会员所发或者网络转载,所述观点仅代表作者本人,不代表起航学习网立场。如有侵权或者其他问题,请联系举报,必删。侵权投诉
IT培训网 访问该机构站点 报名留言 加为好友 用户等级:注册会员
用户级别:10
机构名称:IT培训网
联 系 人:罗老师
联系电话:13783581536
联系手机:13783581536
在线客服:
在 线 QQ:
电子邮件:
网站域名:http://www.itpxw.cn
注册时间:2016-07-18 11:07
最后登录:2024-02-20 13:02
Java定义方法的格式是什么?IT培训网小编来告诉大家。所谓方法...
大家在Java教程中会学到关于Java消息推送的知识,那么,Java消息...
常用的Java日期格式转换有哪些?IT培训网小编来告诉大家。 1...
Java创建对象数组的方法是什么?IT培训网小编来告诉大家。Ja...