发布于 2016-01-15 01:01:22 | 264 次阅读 | 评论: 0 | 来源: 网友投递
百度(Baidu)中文搜索引擎
百度(Nasdaq简称:BIDU)是全球最大的中文搜索引擎,2000年1月由李彦宏、徐勇两人创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。
百度硅谷 AI 研究所 (SVAIL) 今天开源了百度的关键人工智能 (AI) 软件 WARP-CTC,基于 Apache 协议,WARP-CTC 的 C 语言库和可选 Torch 绑定都已托管到 GitHub:
https://github.com/baidu-research/warp-ctc
WARP-CTC 基于 CTC 方法,当前可用的一些 CTC 实现通常要求大量的内训或者是慢十到几百倍。
百度研究所首席科学家 Andrew Ng 称他的研究主要是人工神经网络如何在图形处理单元 (GPUs) 上运行,让 WARP-CTC 实现对 GPUs 和 x86 CPUs 的支持。
connectionist temporal classification (CTC) 方法可以追溯到 2006 年,在 Swiss AI 研究所 IDSIA 论文上有记载。 百度研究所开发的 WARP-CTC 就基于 CTC 方案,但是改进了其自身的语音识别功能。
CTC 方法包括复发性神经网络 (RNNs),在深度学习的 AI 上越来越常用。复发性神经网络已经被证实可以在嘈杂的环境下很好的运行。
Facebook, Google 和 Microsoft 等等一些大科技功能都相继开源了他们的 AI 软件,当前 Facebook 还分享了其 AI 服务器硬件设计。百度也往前迈出一大步,为学术论文做贡献。
已经有大量的 AI 软件开源,百度研究所之前开发的进度一直比较缓慢,所以现在把代码共享出来,希望通过机器学习社区继续提升 WARP-CTC。