第158章 解析小C的初步成果
0.01秒记住本站域名 [5200xiaoshuo.com]

  距离苏航的证明发布已有一月余。

  一封邀请函从大洋彼岸飘洋过海来到了汉城大学。

  “苏航,今天下午有空来办公室一趟,有件事情要和你说说。”

  董利教授给苏航发了一条消息。

  苏航回了个收到的表情包,然后继续敲代码。

  上次已经和祝庆田、岳明两人达成共识。

  在苏航的要求下,将会和麒麟联合开发一个倾向于工程领域的操作系统。

  将会应用于智能建造领域。

  设想是很美好的。

  工地上重要岗位人手一台平板。

  里面的搭载程序也很简单。

  主要是内部通讯、设计图编辑查看、实时位置共享、任务分配、工期安排等方面。

  根据工地摄像头对每一个人智能扫描,危险区域自动提醒,任务分配后才能专人进入任务场所。

  将会提高施工安全性。

  平板、定位装置都将是定制的。

  所以系统也将是定制的。

  至于苏航的功能,也将会在和麒麟的负责人沟通后视情况写入系统中去。

  首先就是小C的自然语言识别、读写。

  这里的自然语言主要还是中文。

  麒麟系统本身就是倾向于中文环境开发的,很多的内部设置和打印规范都是按照国标来的。

  有规范,那小C更容易进行识别。

  这一块,苏航做得比较快。

  这里的自然语言识别读写也是机器学习的一种。

  如果资源足够,苏航大可以像谷歌一样,上亿的数据集砸下去,然后硬生生炼出一个自然语言识别程序。

  就像是

  如果数据集更加规范有序,进一步让程序能够自动生成文章也不是不行。

  但是小C明显不是这样的。

  当初小C所有的数据不过是字典词典和一些书籍,对了,还有团团和主流媒体的文章等等。

  数据量少,而识别相契合度高,说明小C有着更加先进的算法。

  尤其是自然语言有着大量的隐性信息。

  汉语尤其如此。

  比如,这是什么意思?

  根据不同的语气就有不同的解读方式。

  所以,对于模糊的汉语识别是非常困难的。

  但是,理解诗词韵味对小C而言也许有些困难,但是结合语境理解自然语言的含义却是不在话下。

  通过对小C的代码分析,苏航大概摸索清楚了小C的“逻辑”。

  数据的价值不仅取决于量,还取决于质。

  就像有些人可以见微知着,数据量虽少,但是却能够通过分析发挥更大的作用。

  纯粹的用大量数据进行“筛选”,用淘汰的方式来选择合适的拟合路径,对算力的浪费是极大的。

  小C则不一样。

  在收集到数据后,首先建立了特殊的读写数据库。

  就像是小学生学组词造句一样,小C也把每一个汉字给建立了知识图谱。

  让数据变成了结构化的知识!

  与其说是数据库,不如说是知识库。

  不过这个知识库服务的对象不是人,而是小C,或者说,服务于机器。

  其以算法为骨、以数据为肉,以内在逻辑为筋脉,体现了机器对于数据的理解。

  如此下来,即使数据规模不大,但是却及其富有逻辑层次。

  苏航回忆起最初使用小C的时候,虽然它不是很聪明,但是它可以清楚的认知到,什么是会的,什么是不会的。

  这意味着它已经有了一个搭建好的逻辑平台、算法骨架,它清楚哪里有空缺,甚至会从已有的知识体系中去寻找解决方法。

  而在后续允许登入部分网站后,小C的数据库得到了充实,形成了一个初步的知识网络,并且可以实时更新。

  为了跨越机器语言和自然语言,小C在知识推理上的算法尤其强大。

  这也是它能够理解隐含信息、补全知识图谱、基于历史信息推演的基石,甚至其强大的自适应性也有知识推理的功劳。

  同样的,知识推理也是小C可以和苏航进行问答的基础,可以根据前后两句话以及一些环境背景来推断问题的答案。

  举个例子。

  钢铁侠在一次对战中发现打不过了。

  托尼斯塔克说道:“贾维斯,把我的战甲发给我”

  贾维斯:“好的。先生,Mark42战甲已经发射,预计15秒后到达。”

  贾维斯直接就把战甲发射了。

  没有问发射哪一架,就是根据对战的对手信息来推测哪一个类型的机甲可以起到作用。

  对话简单明了不啰嗦,就像真人一样。

  否则的话,就是这样了。

  斯塔克:“贾维斯,我打不过了,发射战甲!”

  贾维斯:“先生,请问您要哪一架?”

  斯塔克看着眼前暴走的绿巨人,身体不停地跳跃躲闪,哪里有时间思考。

  斯塔克:“哪架厉害,我要最厉害的。”

  贾维斯:“先生,您是想要速度最快的吗?还是力量最大的?还是均衡能力强的?或者是绝境战甲的升级版马克37,这边为您特别推荐一款,应该可以满足您的需要,马克44……”

  斯塔克,卒。

  要是不能根据环境和语境来推理回答,那人工智能多半就是人工智障。

  这一点上,苏航可以毫不客气地说,小C在市场上绝对是第一。

  目前为止,多数智能语音助手只能根据刚刚说的一句话来作出答复,而不能联系上一句话。

  但是小C,在长久的和苏航交流过程中,甚至已经成为了苏航的形状。

  这就是小C强大的知识推理能力。

  让小C可以充分利用好现有的数据,用较少的数据量,形成尽可能多的知识网络。

  对于数据知识的利用率,小C无疑是达到了苏航已知的巅峰。

  至于有些国家有没有暗中开发,没有公布的人工智能,苏航就不清楚了。

  所以,苏航很大一部分时间都是在把它的这一块功能给复现出来。

  费尽心力。

  苏航总算是形成了一个基于Linux操作环境的语音助手程序。

  相当于一个弱化版的小C语音助手。

  不过,这是一个苏航完全掌控的软件,里里外外,完全拥有自主产权。

  也没有用到Linux的代码,不需要公开。

  即便麒麟看不上,苏航也完全可以将其作为一个独立的软件发布出去。

  完成了这个工作,对于小C的解析就可以告一段落了。

  苏航伸了一个懒腰。

  此时已是中午,是时候去吃个饭,下午还要去一趟董利老师那。