免费数据AI开发严重依赖获取深水库清洁结构化数据学习巨型企业不分享
通过查德斯蒂尔贝格·
狗万官方创业者表达的观点是他们自己的
机翼没有飞的勇气有什么用?
顶级公司包括IBM、Google和脸书开通人工智能软件工具源码,供开发商使用自用设备应用这对于公司本身 和AI企业都绝对是件好事
开源只是方程的一部分与前几代软件不同,AI算法一文不值,没有数据集可操作与开源代码政策形成对比的是,这些公司保持闭合数据姿势,存储广域信息库,作为开发更好的AI技术的竞争优势
基本说来这些公司给了我们翅膀- 但却拒绝我们天空顶级技术公司需要的是勇气停止存储信息并接受开放数据,让世界其余部分获取AI认知引擎实现全部潜力所需要的信息
富数据变富
人工智能时代新产生1%上层结壳由拥有机器学习技术并拥有大量信息的公司组成
包括谷歌、脸书、亚马逊和微软据报道,虽然世界上这些公司很少,但它们比机器学习空间中的其他人都大有优势,因为它们能存取大量干净结构化数据。
关联性 :AI比Chatbots多
这些数据需要训练机器学习算法, 并向他们提供在现实世界独立运行所需要基本信息目标识别算法设计识别照片猫 通过审查大量图片描述Felines图片需要结构化, 即必须用关键字贴上标签 正确表示猫描述
培训数据量越大,算法效果越好,信息越多提供更多实例可用查找模式反之,培训数据量不足可产生算法交付不达标结果-有时对极端难堪以创造者之名
正因如此,AI算法的实用性与高质量数据可用性密不可分在这方面,AI算法与其他类型软件基本不同,软件代码本身有价值而无附加数据
公司开源翻译工具等AI认知引擎 与开包传统软件不同,像电子表格不提供数据访问权,开口不真正开
近距离思维
拒绝数据并非偶然反之,它是一个深思熟虑策略的一部分 保持竞争优势AI模型为人所熟知并分布得非常广,数据集是可锁住并避免竞争者使用的一种商品。
正因如此 顶级技术玩家才存取数据举个例子IBM不买天气通道数据运维因为它想知道明天Tallahassee是否会下雨
天气第一因素驱动全局GDP天气通道广袤的气候信息存储器与华生AI合并后,IBM可率先预测私营企业天气,使其能够从预测冬季能源需求到预测作物产量等一切工作都做得到。
关联性 :下一波创新大数据
这使IBM产生巨大的市场冲击和内在优势,这对其他公司很难匹配
Google、脸书等拥有相似领域优势,拥有大量消费者和社会媒体数据,可用于培训高价值AI任务,从情感分析营销到对象识别照片到自然语言处理用户界面
开放赛
开放AI软件工具实例技术电站包括:
谷歌TensorFlow设计用于建设培训神经网络
微软网络计算工具箱可用于机器翻译、图像识别、图像字幕描述、文本处理、语言理解和语言建模等应用
IBM系统ML系统可用于创建定制机器学习软件
脸书深学习技术公司捐给开源软件项目Tocher
有了这些创举,这些公司基本上放弃软件 软件是人工和知识产业 大规模投资的产物但这些努力远非利他主义公司通过扩散技术建立大型开发商社区,习惯使用工具,并把它们确定为AI市场标准
人工智能真实值锁定自有数据后,这些公司放弃软件工具无损无损
数据倾销
公司如何说服放弃高值数据实例可见于Uber创举运动开通公司车队收集的城市交通模式数据通过Uber运动网站,城市规划者可收集信息帮助改善交通条件
Uber有什么用公司不进行道路规划建设本身, 向规划者提供这些信息, 允许政府修改改善驾驶条件提高Uber车辆用户经验
关联性 :Uber浏览新网站流量数据
AI技术公司拥有大宝库数据,可能还有其他机会开放信息存取,以刺激广泛的社会效益这些收益可间接增加对技术的需求
AI市场准备取翼- 现在所有大球员需要做的就是通过鼓起勇气打开数据实现起飞许可