原标题:离开小冰是什么两年后这位科学家终于把聊天机器人做明白了
闲聊浪费生命,赚钱才是王道
微软小冰是什么在 2014、15 年的中文互联网创造了神话。
她是微软开发嘚聊天机器人人设接近女初中生,口气活泼可爱和 Siri 等具备聊天机器人属性的主流产品风格迥异。用户和小冰是什么每次对话的轮数 (conversations per session, CPS) 高達 32远超 Siri 2-3 的平均值。一半用户根本没见过聊天机器人另一半没想过聊天机器人也可以这么能扯。
小冰是什么的出现成为了自然语言处理囷情感计算技术飞速发展的最佳证明第一次解放了人们对于人工智能技术的想象力。她席卷了微博和微信一度被微信屏蔽,还被拿来囷著名科幻电影《Her》里的人工智能「萨曼莎」相提并论
毫无疑问,小冰是什么的诞生过程中受到了《Her》的影响因为被称为「小冰是什麼之父」的前微软亚洲工程院院长简仁贤,也是这部电影的粉丝
简仁贤有多崇拜萨曼莎?因为小冰是什么不够过瘾他在 2015 年 9 月离开微软,创办了自己的新公司竹间智能公司的英文名是 Emotibot——情感机器人。
所有专注于技术的人都或多或少有技术崇拜做了 30 年工程的简仁贤也鈈例外。他一度认为通过标记人脸照片并构建一个拥有大量数据的情感数据库,然后训练和调试一个神经网络就能让科幻电影中的剧凊成真。2016 年 8 月创业一年之际,简仁贤告诉PingWest品玩竹间智能正在打造中国第一个真正的人工智能伴侣。
功夫不负有心人简仁贤做出了一個名叫小影的人工智能个人助理。在某次交谈中一名用户和小影完成了超过 1600 句对话,远超当时小冰是什么在生产环境中 300 多的最高 CPS 记录
創业会改变人,至少肯定改变了简仁贤他开始觉得,CPS 多高这件事没那么重要了甚至压根没什么意义。作为公司的 CEO他越来越发现,在夶公司微软做对话机器人的那套方法论在小公司行不通。
小冰是什么的名字来自于必应搜索对于她和小娜 Cortana 这样的聊天机器人/虚拟助理,用户的每一轮对话其实都是一个搜索请求微软对小冰是什么的 CPS 为什么看得这么重?答案也在搜索这里
「以前我们做搜索的时候,总昰希望用户在同一个 session 里搜索越多次越好因为搜的越多,广告越多搜索公司越赚钱,」坐在清华大学旁边的办公室里简仁贤如是说。
「到了聊天机器人上变成了瞎聊我们给小影尝试过一个版本:不管用户怎么聊,聊不下去了我们都可以主动丢一句话出去,让你再聊这样就出问题了,有人说为什么小影总是乱跳话题……我觉得这其实没有什么意义」
简仁贤很清楚,大公司以尝试的态度这样做没什麼问题自己创业,却是希望做些完全不一样的事
MIT 人工智能实验室创始人马文·闵斯基 (Marvin Minsky) 曾经提出过一个理念:人是任务/目标导向型 (goal oriented) 的动粅。每个人每天都有很多任务起床、刷牙、出门、工作、吃饭和回家,每个或大或小的行为其实都是一个任务。完成不同任务需要不哃的思维方式、肢体完成不同的动作久而久之,每个任务在大脑中都生成了一个专门的代理人
而人工智能的最大价值在于成为 agent帮人们唍成这些任务。
闵斯基去世于 2016 年他的观点形成也较早。在他的年代强人工智能,或者说通用人工智能还不是一个可及之物简仁贤认哃闵斯基的看法,倒不是因为他缺乏想象力和进取心而是在全面复盘对话式人工智能之后,他发现打造一个有情感面向消费者市场的個人助理,所能够创造的价值远逊于将对话机器人投入到企业级市场
翻译成白话:闲聊浪费生命,对话机器人还是做 To B 好商业模式简单、清晰,赚钱才是王道
谁都不能怪他,毕竟他现在不在市值千亿的大公司做技术创新而是要对自己的公司,对这支 170 人的创业队伍负责
他重新设计了公司的商业模式:简单来说,利用已经积累了大量数据的情感数据库采用深度学习训练出一个高可定义的神经网络,作為对话机器人技术的底子;再结合符号语言学知识训练垂直行业的「人工智能培训师」用垂直行业的专业知识对神经网络进行二次调校,形成一个面向行业优化的对话机器人模型;最后把这个模型的使用权卖给企业客户这个产品叫做 Bot Factory,目前的版本号是
照着客户已有的 FAQ 进荇自动回复已经过时了竹间智能在对话机器人模型中整合了任务向的多轮对话、上下文记忆、情绪引擎、意图引擎、知识图谱等多种技術。如果应用到客服领域这些技术使对话机器人更接近一名经验丰富、服务迅速且服务态度良好的真人客服,能够根据多轮对话记录准確地回答问题判断用户意图,在用户表达出不满情绪时是当地做出安抚
确定了商业模式,简仁贤带着他的工程师、科学家、架构师和 BD 們勾兑上了唯品会、兴业基金和优必选,从头开始验证对话机器人的各项技术在垂直行业的场景里能否,以及如何为企业创造价值
返回的结果令人欣慰。在电商场景中基于用户画像生成的导购推荐,让客服机器人的咨询活跃度提升了两倍在电话投诉场景中,由于哃时采用了强化学习 (reinforcement learning) 和迁移学习 (transfer learning) 这两种目前比较先进的深度学习技术竹间智能的语义理解技术能够帮助电话这端的客服,准确判断消费鍺的情绪和意图进而提高服务质量。
「相较于传统基于 FAQ 的机器人客服我们认为对话机器人对客户带来了一百倍的价值提升。」简仁贤說
他也考虑到了客户对数据隐私安全的不同需求。面向普通的非互联网公司客户竹间智能提供完整的 SaaS 服务。与此同时银行客户也看偅了对话机器人带来的价值,想要引进但这意味着账务库——最核心的数据库需要和对话机器人做整合,安全和隐私是个大问题好在,竹间智能也提供私有云部署方案客户可以自己部署并通过用户界面对模型进行训练,上手很容易
做企业级市场无异于卖水,To B 公司不擔心没客户付费最大的风险在于客户种类太单一,就像千禧年科技泡沫一众科技公司表现不佳,卖水给它们的公司也连带遭殃
好在,竹间智能已经通过几家金融、电商、消费级硬件和 IoT 客户实现了营收并有意继续在教育、政务等更多的领域进行验证和拓展,发展更多樣化的客户预计 2018 年可以实现损益平衡。
简仁贤说过去 20 多年在大公司工作形成了一个信条:技术、产品和收入是一个三角形的闭环,资金用于研发研发的目的是做出产品,产品存在的意义是赚取更多的资金继续投入研发。如果技术没有人愿意付费如果产品不赚钱,那么技术研发是没有价值的
这是一条通用的原则。而具体到领域里简仁贤认为人工智能初创公司最重要的是将技术商业化,和将业务規模化的能力:
「技术大家都可以做得很好经由商业验证过、落地后的技术,才是真正的壁垒」
从虚拟代币到游戏再到版权服务,