学习Twitter、亚马逊,90岁的《英语词典》这样拥抱数字化

时间:2023-08-09 18:51:32 阅读:

它一直被视为最全面和权威的英语词典。在19世纪中后期,牛津大学出版社承印了《牛津英语词典》的项目,其业务也不断扩充,包括英语语言文字教学书籍等,自此便开启了全球化业务拓展的道路。的推动下,“牛津英语词典”已经从纸质出版物转型成为了语言数据服务品牌。牛津大学出版社目前正着手把这些语言的语料库或者是智能语言数据建立起来。目前,牛津大学出版社正积极推动小语种的智能语言数据。...

现在很少有人知道英语最初只是一种盎格鲁-撒克逊语言,因为现代英语已经演变成一种全球性的“混合语言”。

“预计到2020年,中国英语学习者人数将突破5亿。这意味着中国英语学习者群体将超过美国总人口。从全球来看,这一群体的数量将达到2日前,牛津大学出版社全球业务总裁、词典部主任Casper Grathwohl在接受钛媒体专访时表示。

英语的全球化很大程度上要归功于牛津大学出版社于1928年出版的《牛津英语词典》(OED),它一直被视为最全面、最权威的英语词典。 许多关于英语词汇的学术研究都以《牛津英语词典》为起点。 词典的拼写要求影响了不同地区的书面英语。

牛津英语词典在线查词_牛津英汉词典在线_牛津英语词典在线

1928 年《牛津英语词典》,第一版(平装本)

牛津大学出版社涉足印刷业可以追溯到1480年,是世界上第二古老的出版社,仅次于英国剑桥大学出版社。 起初,仅作为印刷圣经、祈祷书和学术著作的主要印刷商。 19世纪中后期,牛津大学出版社承接了《牛津英语词典》项目,业务不断拓展,包括英语教学书籍等,从此开始了全球业务扩张之路。

Grathwohl 已在牛津大学出版社工作了 20 多年。 从纸质书籍的印刷到现在的在线词典,他见证了牛津大学出版社的历史,以及技术演进的整个过程及其对行业的影响。

OED多语种词典的编纂经过九十年的发展,有着一个复杂而复杂的过程。 Grathwohl表示,首先,在收集语料的过程中,他们需要了解细分市场的需求,然后根据市场需求进行针对性研究并发布研究报告。 在此基础上,团队首先会制作一些样本,并利用样本进行面对面的群体深入研究牛津英语词典在线英语培训,寻找解决市场需求的最佳方式。

完成上述学术工作后,出版商需要做一些财务分析牛津英语词典在线,以确定是否有足够大的细分市场,未来是否有足够的销量,以及是否以电子版或纸质形式出版版本可用。

在格拉斯沃尔的推动下,《牛津英语词典》已经从纸质出版物转型为语言数据服务品牌。

牛津英语词典在线查词_牛津英汉词典在线_牛津英语词典在线

Casper Grathwohl,牛津大学出版社全球业务总裁兼词典总监

牛津英汉词典在线_牛津英语词典在线查词_牛津英语词典在线

“我们不想把纸质词典变成电子词典,这不是一个简单的重复过程牛津英语词典在线,但我们希望词典的内容和使用能够融入到语言学习的过程中。” 格拉斯沃尔说道。

一开始,OED选择与美国硅谷的一些全球科技公司合作。 具体操作方法是对牛津大学出版社收集的所有语料,包括日常生活中遇到的英语词汇进行处理英语培训,将其转化为智能语言数据。 标记并添加注释。

全球科技公司利用这些智能语言数据开发各种应用程序等数字产品和服务,以增强英语学习者的日常体验。

在语言数字化、智能化的过程中,关键是“过滤”——筛选出最准确、最常用的语言。 在虚拟世界中,数据是巨大的。 通过积累专业语料库和专业语言学家处理的语言信息,根据一些语义规则对语言进行分析。 同时,OED团队还将利用自然语言处理等技术手段,从庞大的语料库中抓取所需的信息。

“为什么说这是一个非常难的部分?因为我们现在的处境和三十年前完全不一样了。以前剪辑的时候我们还觉得素材不够,现在我们被一种不知所措的感觉压垮了。”大量的语言。太多了。” 格拉斯沃尔告诉钛媒体。

这就是他们选择与一些全球最大的科技公司合作的原因。 出版社将语言数据提供给科技公司,帮助他们的人工智能学习,也协助他们进行一些翻译工作。 同时,大型科技公司也会建立一些新的工具来分析实际的语言使用情况,然后将数据反馈给出版社,让 Grathwohl 团队能够制作出更准确、更符合实际情况的语言数据库。目前的实际情况。 这是一个双向双赢的过程。

随着技术的进步,语言的“迭代”速度也在加快。 如何处理大量语料? 钛媒体了解到,Grathwohl团队目前主要从新闻报纸获取信息,同时也会参考Twitter等社交网络,甚至关注亚马逊等电商评论,以及当前电影文本中使用的语言。

广泛使用的语言受到巨大数据的困扰,但对于仍然存在的小语言世界中的人们来说牛津英语词典在线,这是另一个世界。 目前只有15种左右的语言在数字世界中拥有大量的数据和说话者。 据不完全统计,世界上有300多种语言,还有100多种语言幸存并在线下广泛使用。 这些语言在高度发达的数字世界中是缺失的。

例如祖鲁语,南非的一种语言,目前可能有1亿人使用,孟加拉语有超过7000万人使用,但它没有任何电子或智能语料库和语言数据。

由于语言缺乏数字化的过程,这些语言的用户无法用母语上网、使用智能手机英语,甚至发送短信。 在虚拟世界中,他们只能用第二语言进行交流和学习。 牛津大学出版社目前正在致力于为这些语言构建语料库或智能语言数据。

“这对于丰富的语言世界来说是一种遗憾。我们非常希望能够保留丰富的多语言环境,让世界上的人们能够享受到丰富的语言环境。” 格拉斯沃尔告诉钛媒体。

目前,牛津大学出版社正在积极推广小语种的智能语言数据。 牛津所做的就是利用自己的科研优势学习Twitter、亚马逊,90岁的《英语词典》这样拥抱数字化,将这些小语言智能化,为大型科技公司提供数据。 这样,科技公司就可以利用小语言进行个性化和本地化,并利用技术让这些小语言拥有自己的虚拟应用环境。 (本文首发于钛媒体,作者/李程程)

更多精彩内容,关注钛媒体微信公众号(ID:taimeiti),或下载钛媒体App

猜你喜欢

《牛津高阶英语词典》(第十版)也是厉害的“斜杠青年”!无论是“写作指南”、“口语指南”,还是“主题词典”,《牛津高阶英语词典》(第十版)都配有相应的在线资源:所以,《牛津高阶英语词典》可是世界上第一部专为英语为非母语人士编纂的“高阶英语学习词典”,也是目前世所公认的最好的学习词典之一。要说全球畅销的高阶英语学习词典,那《牛津高阶英语词典》一定榜上有名。《牛津高阶英语词典》自然也配得上这样的评价。...

冠状病毒促使英语词典提前更新

《牛津英语词典》网页版上的“Covid-19”词条Covid-19正是这样的一个词,它因此被添加为《牛津英语词典》的一个新条目。这次更新超出了《牛津英语词典》通常的季度出版周期,“但这是一个非同寻常的时代,《牛津英语词典》的编纂者和许多其他人一样都在家里工作。...
记得在学生时代,如果谁的英语被评价为Chinglish,那可不是什么好事儿,说明你的英语学的不标准、不地道。“吸收来自全球的不同英语,才能够讲述更完整的语言故事”,牛津大学出版社(中国)词典总编辑如此表示。...

词典在线查询

牛津词典在线查询介绍《新牛津英汉词典》是权威的《牛津英汉词典》,其中包含约360,000个单词,短语和解释,以满足教学,阅读和翻译的需求具有通知栏,可快速检查单词功能,清除发音,从而确保学习就在新牛津英汉词典APP。牛津词典在线查询特色牛津词典在线查询亮点牛津词典在线查询超多贴心设计,处处都是惊喜哦。牛津词典在线查询优势牛津词典在线查询评测牛津词典在线查询更新...

发表评论

评论列表