早期的自然语言自动翻译就是基于规则和推理,但是搞不下去,规则太复杂,有些规则甚至是互相矛盾的。后来IBM开始以统计为基础的翻译,说白了就是学习几乎是一对一的翻译,学得越多,翻译得越地道越准确。这个其实和大脑的学习过程有点相似。 这个过程里面的推理和概率分布所占的成分小了很多,虽然也有一些。 另外一个典型的例子就是语音识别。
分情况的。有唯一翻译标准答案的就直接翻译不需要考虑统计概率了(相当于100%的统计概率,很多需要人工确认判断,就象后来的深蓝下国际象棋),有多种翻译标准答案可行时会需要考虑统计概率来选择。但不是所有的都有答案(特别是人工筛选确认的),大量的语句还是需要靠机器自动学习,这时就更多的需要靠统计概率来自我学习了。不过通过不断的积累,会不断的充实第1、2种情况的资料数据库(已近似人工确认),也就翻译的越来越自然和准确。
建立了一个机器学习的讨论小组,感兴趣的朋友进来讨论: http://www.yangcai168.com/group/mtag/10287/ 程序化交易小组: http://www.yangcai168.com/group/mtag/10304/
如果将事情划分到极度微观,那么一些规律可能就会呈现出来,比如,电子单。那么这种规律只要存在,就是因存在那么果基本就确定,除非有一天有相反的证据证明这种因果被打破。使用计算机学习的好处是学习一遍也许算几个小时就够了,在某种因果被打破以后,后续的因果可能会继续出现,从而被计算机扫描出来。这方面你是专家,比我要在行的多。