trados以前没有接触过,主要是现在更喜欢stardict这类的小工具,呵呵 大概的看了他的描述,可能理解的不是很全面,这个东西主要是依靠句法概率和自用的词汇映射来完成辅助翻译,当然这个过程中应该会涉及到词法、词性作为辅助判断,但按他自己的宣传来说,句法应该存在较大全重,或者反过来说可能主要的精力放在句法的概率匹配上。 如果是这样的话,那么他的高度基本上就可以判读,他就是在不同的key之间作映射,映射关系主要是句法和词频的组成模式,因为没试过,我不确定是否还存在其它方向,但是很显然,他的架构已经决定了它做的不是“解读”,而是“映射”,剩下的只是加载一堆的自适应算法进行概率的判读。 如果基础就是这个范围的话,应该说不一定比当年的译星1.0在高度上有多大的突破,当然我也不认为译星2.0比之前辈有多大突破 IBM这个其实实在没什么可说的。 也可能和接触的方向有关,这个小玩意在国内的应用确实没有碰到过,从IBM软件部门来说,好像没有人主动的提到过。 IBM在语音、文本的处理方面确实投入很大,但是这时和其它的小公司相比,就他自己来说,他其它的产品线的投入更大。 在表意文字,尤其是中文和日文的处理领域,西方国家的相关知识储备并不多,这就是个“边界”问题,西方国家的处理方法从体系上存在着差异,Google就折到这个上面。不要小看这个问题,时至今日,许多的檄文软件是无法进行中文本地化的,东方字符集对软件来说就是一个巨大的障碍,更不用说中文语言了,中科院在这个方面的实力公平的说还算是数一数二的 至于这个小玩意提到的功能,可能我看得确实是太不仔细了,老实说,虽然我不是专门干这个的,但作为一个前客串人员来说,确实没看出有什么特别的地方,所罗列的功能基本上都属于大路货,算法上也没有看到有什么突破性的东西,至少就他所罗列的功能来说,基本上闭着眼睛都能猜出来是怎么搞出来的。 这个比较不好意思了。
看得出来的确去详细的查了 不过在机器翻译方面,译星,google,中科院的确差的很远,可能是搞研究的多是计算机背景而不是翻译背景。还是去试用一下比较好。那个东西支持所有语言(这点的确很牛),而且若干年前就已经采用xml,现在看起来,思路很先进。 TM方面,中科院现在的研究“成果”实在是差的可以,看过他们的成果报告和其产生的“产品”,也有可能偏重于贡献军方,所以对民用就缩水处理。
就民用产品,或者说针对一般市场的产品,其实中科院自己基本上没有提供任何“有用”的东西,以有限的了解感觉,中科院在所谓成果推广方面,一是脱离不开实验室的思路,二是似乎一直抱着一种“找个有钱的傻子一单吃到饱”的思路 翻译这个领域就目前来说,和自然语言理解的研究方向早已经分道扬镳了,原因就是实验室的产品无法提供足够的商品化能力。