二三、科研
书迷正在阅读:本来只想带崽,结果全门都跟我混、Recircle、庄园规则2、[同人] [舰队Collection] 幸色镇守府、诅咒、待到澄澈时、和已婚教授搞上了(1v1甜宠,H)、出轨背德合集(男出轨 逆ntr)、拯救mob文女主计划(np)、请遵守恋爱模拟游戏规则!
困惑着进入了研究生三年级,这时候所里和中科院合作开展了一个机器翻译项目,主导者是中科院计算所的杜鑫。杜鑫当时硕士毕业不久,也在不断尝试,希望打开自己的研究局面。杜鑫能力很强,特别是程式设计的能力,几乎编写了系统需要的所有代码,北大主要提供各种词典和规则,特别是把长期研究的《现代汉语信息词典》实用化,山丰主要参与了规则这部分工作。他们在吴湛的组织下,很快给出了一套规则。具T方法是,先找来一批句子,然後分头完成每个句子的句法分析,并标注出来,然後用程式从中提取出句法规则。这个方法与山丰最初的想法完全不同,山丰本来以为会组织大家整理《现代汉语语法》这类书籍,然後想办法把那些规则写成计算机可以接受的严格的形式,但是难度很大,山丰一直在想,看看吴湛或其他人有没有什麽好的办法,没有想到吴湛用了这麽巧妙的方法解决了这个问题。他们把第一版规则提供给杜鑫,很快杜鑫反馈了意见,规则很粗糙,需要补充和JiNg细地调整。这个任务後来主要由钟红钧和山丰来做,钟红钧b山丰低一级,是中文系的研究生,但是他是跨学科培养的研究生,他也学了很多计算机方面的知识,显然他是最适合这个工作的人选,山丰後来主要是辅助他。那时,他们天天一起去中科院计算所的实验室,和杜鑫随时交流,不断改进系统,他们对山丰帮助很大,结下了深厚的友谊。 这项工作做着做着,山丰又开始有些喜欢计算语言学的研究了,其实不应该想得太远太大,不要总去想那些终极的问题,从这种小的事情做起