首页 排行 分类 完本 书单 用户中心
搜书趣 > 都市 > 重生之乘风而起 > 第一千三百七十八章 思维体系

重生之乘风而起 第一千三百七十八章 思维体系

簡繁轉換
作者:二子从周 分类:都市 更新时间:2024-12-18 20:54:05 来源:源1

“本来是这样的。”周至乐得眼睛都眯缝了:“可是两位师兄提供的字卡太好用了。”

“《字海》的字卡,有编号,有大字,有拼音、民国拼音、甚至还有老四角号码,还有小字的释义和凡例,满足了我们自动识别软件对于调试校准模型的一切要求,我们当然也要用到那头去!”

周至又道:“有了字卡的辅助,我们很快便将软件识别图形文字的准确率,从百分之九十二,也就是一百个字错八个,提升到了百分之九十九点六,也就是依靠软件识别文字,一千个字里只会读错四个。直接提升了一個量级。”

“这个成就,也直接帮我们跨过了数字图书馆最后一个巨大门槛,这个软件,已经算是真正成熟了。”

“这次带来的数字化的《字海》,就是我们第一本通过计算机扫描识别技术建立起来数字图书,既然字数最多的《字海》都可以实现数字化,那对其余典籍,我们当然充满了信心!”

“那就是古籍数字化工作可以提上日程了?”韦一心大喜:“我们学校正在搞《四库全书丛目》这部大书,要不肘子你来我们学校?学籍什么的好说……”

一边计算机中心主任也连连点头:“其实清华那边没去头,肘子你到底是文科生,来我们这儿正好搞古籍数字化工程,想想看,这个大工程搞出来,那会是多大成就?古人说的君子三立,立德立功立言,不都在里边了?”

周至听得心中暗笑,应该说北大的文化氛围的确可以的,你看计算机中心主任都说得出君子三立这样的命题解读来……

不过这事儿暂时没有可能,周至只好笑着解释:“我们蜀大的《道藏》,《儒藏》两部大书也准备开修了,师爷爷是不可能放人的。”

“不过现在有了好工具,哪怕我不来北大,大家也能够加快工程的进度。现在还是说回正事儿,我利用数字化的《字海》,演示一下我们对数字典籍整理的工程架构协议及标准。”

这个东西是周至的自创,哪怕上一世,这也是图书典籍工程里没有过的东西。

直到周至穿越回来之前,国家将典籍进行数字化的工作,主要还停留在建立树状数据库的较为原始的应用阶段。

就好比一个标准的图书馆,将一本书作为一个文本文件整体存放,然后给这个文件编出,书名,书号,最多再给出个作者,出版社之类的信息,作为标签。

这样做的好处就是简单明了,升级维护也容易,信息保存也算全面,一句话说完,就是够用,但不好用。

这样的东西在周至眼里当然是不合格的,最多最多只能算是地基,离百尺高塔还差着老远的功夫。

信息工程就是这样,算法和协议的思路,往往比基础工作还要重要,如果指导思想发生了错误,等到工程进展到不敷使用,才想着改弦易辙,在已经叠房架屋的情况下,再要开展,将付出巨大的代价。

后世中文编码的巨大混乱情形,就是这种教训的最好注脚。

这些思路,是在四叶草的研发思想,周至提出来的“如何三问”原则思想指导下梳理出来的。

“如何三问”听着玄奥,其实很简单质朴,就是对于任何需求,我们要问三层以上的问题。

比如典籍数字化工程,按照一般的思路,好不好用?

答案肯定:不好用。

那第一个如何就来了:如何让它好用?

答案也简单:除了将一部部书籍扫描成文本文档外,还要在这个基础上,建立起一个庞大的标签体系和智慧搜索引擎。

那第二个如何就来了:如何建立起一个庞大的标签体系和智慧搜索引擎?

答案就是需要一个能够根据文档内容,自动化地分析提取特征标签的标签采集软件;要完成智慧搜索引擎,又需要一个球网状的数据拓扑关联系统。

那第三个如何就来了:我们如何开发这个标签采集软件和球网状的数据拓扑关联系统。

答案就是软件硬件并行,软件上,利用现在最新的数学统计学原理,引入计算机模型当中,开发出一套特征提取算法和特征联动算法,并将这套算法作为指导思想,完成软件开发。

硬件上,要克服现有计算设备算力不足的情况,就利用网络时代的助力,将广域网上的所有算力资源都最大程度地利用起来,研发出基于互联网基础的分布式算力应用系统。

这套理念现在还比较初步,但是根据这个理念建立起来的数字化《字海》,却非常的清晰明白,周至还牵头发明了一套论述体系,通过三维图层的方式来讲解一页字卡上,各项内容之间的复杂关联关系。

这隔着图示讲解下,韦一心和冷玉龙就能够看见平面化的字卡,变成了一个类似秸秆蝈蝈笼子,或者说像折叠式灯笼打开后的样子,各个图层之间通过算法将每一层的特征标签连接起来,构成了字卡的立体结构。

对于这一套思维体系,学文科的人理解起来甚至比学理科的还要容易,跟计算中心的曾教授,周至还要讲解一番,而两位老师兄却看得倍感舒适。

因为在两位老师兄的脑海中,关于字卡的知识体系,就和周至现在在信息系统里展现出来的那样!

冷玉龙开心地鼓起掌来:“妙极,妙极!什么叫青出于蓝,这就叫青出于蓝!谁能想到有一天书本的每一页会变成立体的?!哈哈哈哈,这是我们花了多少年才在脑海里构建起来的东西,现在却一目了然了,这个数字图书,有点东西啊!”

刚刚周至给他们讲的很多技术细节他们也闹不明白,但是这些技术细节支撑起来的应用却让他们太熟悉了,不由得生出了一种“他乡遇故知”的惊喜感。

“五四时期的诸多贤达,曾对我们的国学失望至极,认为汉字都没有存在的必要,或者字符化。”周至笑道:“这是一种毫无依据的悲观估计,然而直到今天,这样的流毒居然还有市场,那就实在是匪夷所思了。”

“这话也不能空说。”两位老师兄都是踏踏实实搞学术的人,冷玉龙就说道:“你得拿出足够强大的理由来,不然不就是又犯了五四学人的错误?”

(本章完)

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体风格
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
收藏
换源
听书
听书
发声
男声 女生 逍遥 软萌
语速
适中 超快
音量
适中
开始播放
推荐
反馈
章节报错
当前章节
报错内容
提交
加入收藏 < 上一章 章节列表 下一章 > 错误举报