爱吧机器人网 » 技术 > 机器学习 > 正文

IBM与Spark合作 引领机器学习新时代

\
  Spark 是目前相当受欢迎的开源丛集运算架构,相较于 Hadoop,Spark 拥有敏捷快速的效能和便于应用的优势,因其采用内存储存数据资料,使它拥有高效运算;而通用的 API协助使用者编写复杂的平行运算程序,让 Spark 程序更容易开发和理解。凭藉高效能优势,Spark 已成为机器学习的重要工具。IBM 日前宣布加入 Spark 社交,IBM 期望和 Spark 社交暨其核心关系企业 Databricks 合作,共同引领海量资料及机器学习领域迈向未来发展。

  强化 Spark 的机器学习能力、创新演算法开发

  台湾IBM 软件事业处商业分析业务协理胡育铭表示,IBM 美国旧金山 Spark 技术中心有超过 200 位的技术人员正在将 Spark 技术具体实现在企业应用中。同时,也将 Spark 嵌入IBM 领先业界的分析和商务平台,让 Spark 成为IBM Bluemix 平台上的服务之一。另外,IBM 在全球十多个实验室将投入超过 3,500 名研发人员展开与 Spark 相关的专案,并让 Spark 开放生态系能使用IBM 研发超过十年的机器学习技术–SystemML,IBM 的认知运算系统Watson(华生)便整合许多 SystemML 机器学习的功能。此次IBM 与 Databricks 合作,即是希望结合 SystemML 的功能,让 Spark 具有更强大的机器学习能力,以及让资料科学家更专注于演算法的应用,而非专注于枝微末节的技术。

  Open Data Platform(ODP)是众多资讯企业联合成立的 Hadoop 资料平台,然而对大部分企业用户而言,开源并不代表可直接使用,所以在开源之上又推出 Hadoop 资料平台。希望在选择 Hadoop 资料平台中的核心元件时,大家可以选用公共、统一的代码。如此,透过使用 Hadoop 资料平台,使用者可不再受限于特定厂商的开放源代码,既利用开源的好处,同时也让企业用户不再备受束缚。胡育铭进一步表示,IBM 一直致力于将企业客户的需求与最新技术进行有效衔接,然而新技术很多,很可能会出现讯息孤岛的情形,我们能将新的技术为企业需求真正合而为一,将所谓的单点和孤岛进行整合。IBM 对企业应用的丰富经验是许多商业分析解决方案供应商无可比拟的,例如新元件一直出现以及重要技术持续变化,透过 Open Data Platform (ODP)开放平台,让多家资讯公司在平台上贡献经验与想法,为企业客户提供服务。

  IBM 专精于分析探勘语言及 SQL 关联式数据库领域已长达 30 多年,具备大量的优化技术。此外,SPSS 的许多预测分析产品的演算法也可与 Spark 相互结合,因为 SPSS 得以让 Spark 大幅提升处理资讯的资料量、速度与能力。未来IBM将陆续推出 Spark 系列产品,包括Watson Analytics、DataWorks、PuerData 以及其他解决方案。

  全球IBM 投资超过两百五十亿美元培养 Spark 技术人才

\

  Spark 具备敏捷快速、便于应用的特性,而其开源属性可在全球持续改进,未来IBM 的专家将与 Apache Spark 开放社交合作,推动先进机器学习技术,并加快智能创新业务应用开发的速度。IBM 在开放源代码创新领域已经耕耘多年,我们深信开源的力量是客户创造价值的根源,IBM 将全力支持 Spark,将其作为推动分析的基础技术平台,从根本上加速推动业务创新,协助客户部署和运用 Spark 推动商业分析策略,实现业务转型和差异化竞争优势。

  除支持 Spark 之外,IBM 透过向下扎根方式与大中华区大专院校合作,如宣布投资 1 亿美元,在大中华推动“U100”计划;在台湾,IBM 已在政大、台大、交大等多所大专院校开立商业分析(Analytics)课程,期望能培养更多未来的资料科学家,截至目前为止,全球IBM 在商业分析领域已投入超过 250 亿美元。


上一篇:深度学习能否取代其他机器学习算法?
下一篇:机器学习编程语言之争,Python夺魁
精选推荐
改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来使消费者受益
改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来

[2018-12-08]  市场研究公司IHS Markit预测,到2020年,专业无人机市场将通过农业,能源和建筑等行业利用测量,制图,规划等技术实现77 1%的复合年增长率(CAGR)。与此同时,消费者无人......

麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群
麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群

[2019-10-31]  几天前,小编向大家介绍过麻省理工(MIT)研发的一种自组装机器人集群(点此阅览),它们可以用统一标准的小单元自动组装出各种大型结构。 ...

从AI中窥探人性
从AI中窥探人性

[2018-01-03]  人们对人造智能的恐惧早已成为科幻书籍和电影的极好题材。但现在,一些同样的担忧开始影响关于现实世界AI技术的政策讨论。如果这样的担忧演变成为一种技术恐慌...

2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

人工神经网络技术解码人类行为和想象时的大脑活动信号
人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23]  为搜索引擎过滤信息,棋盘游戏对弈,识别图像 人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图
谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图

[2019-10-26]  谷歌刚刚宣布,其搜索引擎的核心算法正在进行一项重大升级,这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术(BERT ...

MIT最新“人机”互连系统 让双腿机器人复制人体技能
MIT最新“人机”互连系统 让双腿机器人复制人体技能

[2019-11-01]  MIT的小爱马仕想借用你的大脑 ,图片来自: João Ramos爱吧机器人网消息,麻省理工学院(MIT)的研究人员展示了一种新型遥操作系 ...

Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

本周栏目热点

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......

机器人是怎么深度学习的?

[2016-03-29]      一个人独处时,感觉有点孤单,怎么办?微软亚洲研究院推出的微软小冰,或许 ...