再说说人工智能

（1）我们在探索应用

一、自然语言处理

自然语言处理是我们应用最广泛的。所以我们除了机器翻译没有探索外，其他我们都有涉猎：

1、多轮问答、会话

2、意图识别、情感分析

3、搜索、推荐

4、摘要、生成、Table2Text

二、语音

语音和自然语言处理比较近。

虽然我们也需要语音识别、语音转文本、文本转语音合成。

但国内有科大讯飞这个专业厂商在，我们就不研究了。

三、视觉

视觉四小龙主要聚焦在：人脸识别了。

而我们仍然聚焦在和自然语言处理相近的视觉，那就是OCR。

OCR也分很多应用任务：

1、证照识别

2、单据票据识别：包含票据里的印章弯曲文字识别

3、文档OCR：如文档中的复杂表格识别，甚至还有手写签名识别

4、自然场景下OCR：如道路标识、门头、菜单/商品说明

四、应用场景

我们也确定了：社会计算，这一应用主题。

围绕社会计算：社会化营销-社会化供应链-社会化金融，是我们确定的三大应用场景。

这三大应用场景，我们在2019（社会化营销）、2020（社会化供应链）、2021（社会化金融）也做了许多工作。

（2）我们也在夯实基础

一、经典机器学习

我们在不断探索：经典的概率统计、分类聚类

我们也在不断探索：时间序列预测、运筹学

二、知识嵌入

我们在不断探索：知识图谱/事件图谱、图神经网络

我们也在不断探索：因果推断、知识推理

三、少数据少样本少训练

我们在不断探索：Transformer、骨干网络结构

我们也在不断探索：迁移学习、对比学习、强化学习，期盼做到自监督、无监督

四、多模态

我们主要在一梭子Transformer横穿自然语言处理、视觉OCR两大数据和应用领域

当然，我们也在期盼有一梭子的方法，能横穿中文、英文。我们发现很多方法对于英文效果很好，但就不适用于中文。

（3）期盼业界突破

微软亚洲研究院堪称是中国人工智能的黄埔军校。

有擅长人才吸引的：李开复

有擅长理论研究的：沈向洋

有擅长工程实现的：张宏江

有擅长应用场景的：张亚勤

一、数据

突破方向有二：

1、突破一：中文。现在全世界人工智能领域，都是适合英文处理的理论方法、框架工具、数据集。中文的太少。

2、突破二：多模态

主要以北大人才为骨干的、张宏江博士做主力支持的智源研究院，在中文多模态数据集、中文巨模型的建设方面很好。

二、工具

现在满世界都是适合英文处理的理论方法、框架工具、数据集。中文的太少。中国幸好有了百度PaddlePaddle，这是一个适合处理中文的框架工具。

但是对不起，PaddlePaddle还主要在通用平台级，在应用任务级还有很多的空白、效果短板。

2020年，从微软亚洲研究院、百度出来的张亚勤，组建清华大学智能产业研究院（AIR），它的使命是：利用人工智能技术赋能产业升级。它主要面向三大应用场景：智能工业互联网、智能交通、智能医疗。

三、理论

在中文世界，人工智能理论突破性不多。我挺期盼沈向洋的。期盼他在清华大学高等研究院好好沉一沉。而且他作为小冰的董事长，小冰的海量多模态数据，也会给他的理论研究工作带来很好的辅助。

参与讨论

298680

130

相关文章

App

公众号

微信群

再说说人工智能

参与讨论

298680

130

相关文章

注册

绑定手机号

绑定已有账号

修改密码

找回密码

找回密码

上传进度