六月二十日,周三,清华园。
    下午三点,主楼报告厅门口排起了长队。两百个座位早已坐满,过道里站满了人,窗外还有人踮脚往里看。横幅掛在讲台后方:“中文信息处理的黄金时代——金牧公开课第一讲”。
    林牧站在幕后,透过缝隙看著台下。黑压压的人头,年轻的面孔,眼睛里闪著光。最前排坐著几位老教授,王选院士坐在正中间,正和旁边的系主任低声交谈。
    雷军走过来,压低声音:“林总,都准备好了。演示电脑检查了三遍,投影仪调试好了,备用方案也ready了。”
    “微软那边有什么动静?”林牧问。
    “来了三个人,坐在后排。”雷军说,“戴维·王没来,来的是中国区的技术总监和两个助理。还有……”他顿了顿,“《计算机世界》和《中国青年报》的记者都到了,坐在媒体席。”
    “好。”林牧整理了一下西装——叶溪溪特意给他买的,深灰色,合身,“按计划进行。”
    三点十分,主持人上台:“各位老师,各位同学,今天我们非常荣幸地邀请到bj金牧软体公司创始人、『青年科技先锋』获得者林牧先生,为我们带来题为《当汉字遇见代码》的公开课。掌声欢迎!”
    掌声雷动。
    林牧走上讲台,站定,目光扫过全场。
    “各位老师,各位同学,下午好。”他开口,声音通过麦克风传遍报告厅,“站在清华的讲台上,我很惶恐。因为台下坐著的,可能是中国未来最好的程式设计师、最好的工程师、最好的科学家。”
    台下安静下来。
    “但我今天想讲的,不是技术,不是代码,而是一个问题。”林牧切换ppt,幕布上出现一张照片——敦煌莫高窟的藏经洞,成堆的经卷。
    “1900年,王道士发现了这个藏经洞。里面封存著从魏晋到宋元的五万多卷文献。但隨后几十年,这些文献流散到世界各地,大英博物馆、法国国家图书馆、日本京都大学……中国人要研究自己的文献,得去外国。”
    他切换下一张照片:发黄的古籍,虫蛀的页面。
    “这是我们师大图书馆的宋版《史记》。每次翻动,都有纸屑掉落。管理员说,最多还能翻五十次,这本书就碎了。”
    再下一张:计算机屏幕,上面是密密麻麻的代码。
    “这是我们正在做的古籍数位化引擎。”林牧说,“用计算机视觉识別字形,用自然语言处理断句標点,用排版引擎还原版式。目標是把五千年的文字,完完整整地搬进计算机,让它们永远不腐,永远不碎。”
    台下响起窃窃私语。
    “我知道有人会问:这有什么用?”林牧顿了顿,“是啊,有什么用?不能吃,不能穿,不能赚钱。微软的office能帮学生写作业,能帮会计做报表,能帮秘书打文件。我们的古籍引擎,能干什么?”
    他看向台下:“我只能说,有些事,不是因为它有用才做,而是因为做了,它才有用。”
    “一百年前,有人问:保存这些破经书有什么用?今天我们知道,那是中华文明的根。一百年后,可能有人问:把古籍数位化有什么用?我希望到那时,我们的后代可以说:因为数位化了,所以我们还能读到李白杜甫,还能看到《清明上河图》的题跋,还能知道我们的祖先在想什么、写什么、梦什么。”
    掌声响起。
    林牧等掌声稍歇,进入正题:“好,情怀讲完了,现在讲技术。”
    他回到电脑前,打开古籍引擎的演示程序。
    “这是我们团队过去三个月的工作成果。”屏幕上出现一个简洁的界面,“左边是扫描的古籍图像,右边是识別结果。目前支持楷书、行书、草书三种字体,识別准確率在95%以上。”
    他拖入一张《兰亭序》的扫描件。
    点击“识別”。
    进度条快速走动。五秒后,右边出现工整的繁体字文本。
    “这是基础识別。”林牧说,“接下来是智能断句。”
    点击“断句”。
    文本自动添加了標点——不是简单的句號逗號,而是根据文言文语法规则添加的。“之乎者也”处理得恰到好处。
    “然后是排版还原。”点击第三个按钮。
    文本自动排列成竖排,从右到左,字体调整成仿宋体,加了浅朱丝栏线——完全復原了古籍的版式。
    台下响起惊嘆声。
    “最后,”林牧说,“是翻译適配。”
    他选择“现代汉语適配”,点击。
    竖排繁体文言文,瞬间变成横排简体白话文,但保留了原文的韵律和意境。
    “这……”一位老教授站起来,“这是怎么做到的?”
    “用了一个我们自研的模型。”林牧调出技术架构图,“核心是基於注意力机制的序列到序列模型,训练数据是五千多份古籍和对应的现代汉语译本。模型学会了文言文到白话文的映射规则,不是逐字翻译,而是整体理解后的转译。”
    他顿了顿:“这个模型,我们今天开源。”
    全场譁然。
    “所有代码、所有数据、所有模型参数,全部公开。”林牧调出金码社区的连结,“任何高校、任何研究机构、任何个人,都可以免费使用、修改、再发布。只有一个要求:如果你基於这个模型做出了新成果,请也开源。”
    后排微软的人脸色变了。
    “我知道有人会担心:开源了,別人抄袭怎么办?”林牧看向后排,“但我想说:如果中国的古籍数位化,因为害怕抄袭而裹足不前,那才是最大的悲哀。”
    他提高声音:“我们不怕抄袭,只怕没人做。如果全中国的研究者都用我们的引擎,都来改进它,那三年后,中国將是世界古籍数位化的中心。这个中心,不在微软,不在谷歌,在清华,在北师大,在每一个热爱中国文化的人手里。”
    掌声如雷。
    王选院士站起来鼓掌,旁边的系主任也跟著站起来。很快,全场起立。
    后排微软的三个人,在掌声中悄悄离场。
    公开课持续了两个小时。林牧讲了技术细节,讲了开源理念,讲了金牧的“种子计划”。提问环节,学生们的问题一个接一个:
    “林总,我是中文系的,不懂编程,能参与吗?”
    “能。我们需要文言文专家,需要校勘专家,需要版本学专家。技术只是工具,核心是文化。”
    “开源项目怎么盈利?”
    “短期不盈利。但当我们成为標准,当我们建立了生態,盈利会自然到来。就像linux,就像apache。”
    “微软会继续打压你们吗?”
    “会。但打压越狠,说明我们越对。”
    最后一个问题来自一个戴眼镜的男生:“林总,我是计算机系大三的。我想毕业后去金牧工作,你们还要人吗?”
    林牧笑了:“要。但我们没钱,工资不高,加班很多,还可能隨时倒闭。要来吗?”
    “来!”男生大声说,“钱不重要,重要的是做的事!”
    全场大笑。
    公开课在五点半结束。林牧被学生们团团围住,要签名,要合影,要联繫方式。
    等脱身时,天已经黑了。
    王选院士在门口等他。
    “小王,”院士拍拍他肩膀,“今天讲得很好。但我要提醒你,微软的反扑,会比你想的更狠。”
    “我明白。”林牧说。
    “古籍数位化是个好招牌,但也容易被人攻击。”王选说,“我已经听到风声,有人准备写文章,说你们『浪费国家资源做无用功』,说『古籍就该保持原样,数位化是对文物的褻瀆』。”
    林牧皱眉:“这……也太牵强了。”
    “但能煽动情绪。”王选说,“舆论战,从来不讲道理,只讲情绪。你得有准备。”
    “谢谢院士提醒。”
    回到公司,已经是晚上八点。
    林牧一进办公室,陈静就拿著一沓报纸衝进来。
    “林总,你看!”
    《科技日报》,第二版,標题醒目:《古籍数位化:一场昂贵的数字游戏?》
    副標题:专家质疑金牧软体“烧钱”项目,称应优先发展实用软体。
    文章引用了几位“不愿具名的专家”的话:
    “古籍数位化听起来很美,但实际意义有限。中国还有那么多企业用不起正版软体,应该先解决实际问题。”
    “金牧作为国家项目承担单位,拿著纳税人的钱做这种小眾研究,是否合適?”
    “与其花几百万数位化古籍,不如多开发几个像wps这样的实用软体。”
    文章最后一段:“记者尝试联繫金牧软体,截至发稿未获回应。”
    “这是第一篇。”陈静说,“我托朋友打听了,后面还有。《计算机世界》下周有个专题,《中国电子报》也在准备稿件。都是同一个调子——质疑古籍数位化的必要性,质疑金牧的动机。”
    林牧放下报纸:“谁组织的?”
    “表面上是几家媒体自发,但背后……”陈静压低声音,“我同学在《科技日报》,他说文章是微软中国公关部提供的素材,专家也是他们推荐的。”
    “意料之中。”林牧说,“舆论战开始了。”
    他想了想:“我们有几件事要做。第一,写反驳文章,但要找第三方写——找高校教授,找图书馆专家,找文化学者。我们不能自己下场吵,那会显得小气。”
    “第二,加快演示版的完善。下个月工信部的立项会,我们要拿出让所有人闭嘴的成果。”
    “第三,”他顿了顿,“启动『古籍守护者』计划。”
    “什么计划?”
    “面向全国徵集古籍扫描件。”林牧说,“任何人,只要有古籍,拍照上传,我们就免费数位化,把成果回馈给提供者。同时,招募志愿者,文科生可以帮忙校勘,理科生可以帮忙开发工具。我们要把这件事,变成一场全民运动。”
    陈静眼睛亮了:“这样舆论就不好攻击了——我们是在发动群眾保护文物,不是烧钱做研究。”
    “对。”林牧说,“而且,一旦有成千上万人参与,微软再想抹黑,就是跟全国人民作对。”
    “我这就去准备!”
    陈静离开后,林牧打开电脑,登录金码社区。
    古籍引擎的开原始码,下载量已经突破八千。留言板有五百多条留言,大部分是支持和感谢。
    他翻到最新的一条,id是“国图小李”:
    “我是国家图书馆古籍部的工作人员。今天听了清华的公开课,很受震撼。我们馆有二十万册古籍,很多已经脆得不敢翻。如果你们的引擎真能用,我想申请合作。”
    林牧立刻回覆:“请留下联繫方式,我们派人接洽。”
    刚发出去,又一条新留言,id是“铁马冰河”:
    “后门事件的后续分析我写完了,发在你邮箱。另外,微软的技术清道夫最近在盯你们的社区,他们註册了十几个马甲,准备发负面评论。我已经设置了过滤规则,但你们也要注意。”
    林牧回覆:“收到。运行时环境的架构图我画了个初稿,发给你看看。”
    处理完社区事务,已经是深夜十一点。
    林牧正要下班,手机响了。
    是叶溪溪。
    “哥,你看电视了吗?”她声音兴奋。
    “没有,怎么了?”
    “新闻联播!最后三分钟,讲了古籍数位化!用了你公开课的镜头,还採访了王选院士!”叶溪溪说,“院士说,这是『用现代科技守护千年文脉』,说你和你团队是『文化传承的工程师』!”
    林牧愣住了。
    新闻联播……那是最高级別的肯定。
    “还有呢,”叶溪溪继续说,“我们系主任看了新闻,当场决定成立『古籍数位化兴趣小组』,让我当组长!他说,文科生也要懂技术,不能落后时代!”
    林牧笑了:“恭喜叶组长。”
    “少来!”叶溪溪嗔道,“对了,爸让我告诉你,他看了新闻,很高兴。说……说你这小子,总算干了件像样的事。”
    林牧心里一暖。
    掛了电话,他打开电视,调到回放。
    新闻联播的最后三分钟,果然有他的镜头——站在清华讲台上,背后是《兰亭序》的数字復原画面。王选院士的採访片段,话语鏗鏘:“这不是简单的技术项目,这是文化抢救。五千年的文明,不能断在我们这一代人手里。”
    画面最后定格在一行字:科技赋能文化,创新传承文脉。
    林牧关掉电视,靠在椅子上。
    窗外的北京城,万家灯火。
    他知道,新闻联播的报导,是一把双刃剑。一方面,给了金牧最高的背书;另一方面,也把金牧推到了聚光灯下,成了靶子。
    但无论如何,这条路,走对了。
    他打开邮箱,铁马冰河发来的运行时环境架构图,已经躺在那里。
    点开,是一张极其复杂的技术图——从底层驱动到应用框架,从文件系统到图形界面,层层叠叠,但结构清晰。
    邮件正文只有一句话:“给我半年,给你一个能跑的世界。”
    林牧回覆:“好。需要什么?”
    “人,钱,信任。”
    “都有。明天开始,你就是『长风』计划的技术负责人。雷军会配合你。”
    回復完,林牧站起来,走到窗边。
    夜色中,中关村的霓虹依然闪烁。
    远处,微软中国的办公楼,还有几层亮著灯。
    近处,金牧的窗户,也亮著。
    像两军对垒的营火。
    但林牧知道,他点燃的这堆火,连著五千年的薪火。
    这火,传了五千年,不会灭在今天。
    手机又震动,是雷军发来的简讯:
    “林总,刚接到通知,工信部的古籍数位化立项会,提前到下周。微软也报名了,他们推出了『microsoft digital library』方案,號称全球领先。”
    林牧回覆:“知道了。通知所有人,明早八点开会。我们得提前亮剑。”
    放下手机,他看著窗外的灯火。
    下周,又是一场硬仗。
    但今夜,至少可以睡个好觉。
    因为今天,他们站在了光里。
    这光,是从五千年前照过来的。
    他们要做的,就是把它传下去。

章节目录

重回90年,从中关村开始当大佬所有内容均来自互联网,欲望社只为原作者佚名的小说进行宣传。欢迎各位书友支持佚名并收藏重回90年,从中关村开始当大佬最新章节