业界动态
修复“敦煌遗书”的AI模型背后,不只是硬科技,更有人情味,扫描,人工智能,古籍
2024-07-07 02:30:17
修复“敦煌遗书”的AI模型背后,不只是硬科技,更有人情味,扫描,人工智能,古籍

7月4日至7日,2024世界人工智(zhi)能大会(WAIC)在上海举行(xing),本次WAIC以“以工商促共享,以善治(zhi)促善智(zhi)”为主题,重点围绕核心技术(shu)、智(zhi)能终(zhong)端、应用赋能三(san)大板块,聚焦大模型、算(suan)力、机器人、自动驾驶等(deng)领域。

在展会现(xian)场,一卷AI修复后(hou)的高清版“敦煌遗(yi)书(shu)”引发围观,公众可(ke)在不同位置扫(sao)描样(yang)本卷轴,见证AI如何通过字(zi)形修补、褪色(se)修复、背景(jing)补全。

“敦煌遗(yi)书(shu)”是敦煌莫高窟(ku)藏经洞(dong)出(chu)土的公元4至11世纪的古写本及印本的统称,所涉内容广(guang)泛,被誉为“中国中古时代的百科全书(shu)”。然而(er)在晚清时期,它们被迫流散于世界各地,且大量文献存(cun)在不同程(cheng)度的残损,敦煌遗(yi)书(shu)的保护(hu)、传承工作,时刻牵动着社会公众的心。

在合合信息展台,我们看到了敦煌遗(yi)书(shu)系列文献中《汉书(shu)·刑法志》节选章节的AI修复版本。那些脏污、残缺、磨损的字(zi)迹在“AI古籍修复模型”的加持下,一一变得清晰可(ke)辨。这份(fen)曾凋(diao)零在千年时光中的残卷,被AI拂去岁月的痕迹,第一次以完整的姿态展示(shi)给关注者们。

7月4日至7日,2024世界人工智(zhi)能大会(WAIC)在上海举行(xing),本次WAIC以“以工商促共享,以善治(zhi)促善智(zhi)”为主题,重点围绕核心技术(shu)、智(zhi)能终(zhong)端、应用赋能三(san)大板块,聚焦大模型、算(suan)力、机器人、自动驾驶等(deng)领域。

在展会现(xian)场,一卷AI修复后(hou)的高清版“敦煌遗(yi)书(shu)”引发围观,公众可(ke)在不同位置扫(sao)描样(yang)本卷轴,见证AI如何通过字(zi)形修补、褪色(se)修复、背景(jing)补全。

“敦煌遗(yi)书(shu)”是敦煌莫高窟(ku)藏经洞(dong)出(chu)土的公元4至11世纪的古写本及印本的统称,所涉内容广(guang)泛,被誉为“中国中古时代的百科全书(shu)”。然而(er)在晚清时期,它们被迫流散于世界各地,且大量文献存(cun)在不同程(cheng)度的残损,敦煌遗(yi)书(shu)的保护(hu)、传承工作,时刻牵动着社会公众的心。

在合合信息展台,我们看到了敦煌遗(yi)书(shu)系列文献中《汉书(shu)·刑法志》节选章节的AI修复版本。那些脏污、残缺、磨损的字(zi)迹在“AI古籍修复模型”的加持下,一一变得清晰可(ke)辨。这份(fen)曾凋(diao)零在千年时光中的残卷,被AI拂去岁月的痕迹,第一次以完整的姿态展示(shi)给关注者们。

高清版“敦煌遗(yi)书(shu)”。南都记者 马宁宁 摄

敦煌遗(yi)书(shu)《汉书(shu)o刑法志》修复效果(guo)展示(shi)(局部)。

AI技术(shu)助力古籍修复,推动文化与科技融合创(chuang)新

数字(zi)化修复是延续古籍生命(ming)力的重要手段。据介绍,“AI古籍修复模型”由(you)合合信息旗下扫(sao)描全能王(wang)团(tuan)队携手华南理工大学团(tuan)队共同打造,双(shuang)方将AIGC技术(shu)应用于敦煌遗(yi)书(shu)残卷的数字(zi)化修复,成功解决了中文古籍文档中存(cun)在的文字(zi)残缺、字(zi)迹污损难辨认等(deng)问题。

其中,扫(sao)描全能王(wang)团(tuan)队提供了智(zhi)能高清滤镜算(suan)法支持,使得AI古籍修复模型具备优秀(xiu)的图(tu)像处理能力,可(ke)解决古籍文献中存(cun)在的模糊、阴暗等(deng)图(tu)像质量问题。基于待修复区域的内容和位置先验(yan)信息,模型可(ke)智(zhi)能学习不同古籍文字(zi)风格、纸张背景(jing),对损坏区域的字(zi)体内容、风格进行(xing)高度还原(yuan),尽量确保修复区域的文字(zi)风格和背景(jing)与原(yuan)古籍的一致性,用科技让(rang)文化遗(yi)产焕新。

本次世界人工智(zhi)能大会期间,合合信息展位开放了敦煌遗(yi)书(shu)合成样(yang)本的文字(zi)修复体验(yan)项目,观众可(ke)以在不同位置扫(sao)描样(yang)本卷轴,见证AI如何通过字(zi)形修补、褪色(se)修复、背景(jing)补全等(deng)方式,完成古籍的数字(zi)化修复。

世界人工智(zhi)能大会敦煌遗(yi)书(shu)文字(zi)修复效果(guo)演示(shi)。

据现(xian)场工作人员介绍,古籍修复团(tuan)队目前主要在图(tu)像修复领域进行(xing)了新的探(tan)索,重点关注修复过程(cheng)中的古籍页面环境分析及处理,文字(zi)字(zi)体自动学习及补全,色(se)彩(cai)还原(yuan)等(deng)领域。团(tuan)队成员表示(shi),古籍的数字(zi)化修复是一项艰(jian)巨、浩大的工程(cheng),未(wei)来也希望能联通更多专业的文献研究机构(gou)及技术(shu)专家,共同提升数字(zi)化修复精(jing)度与效率,促进古籍文物的时代价值(zhi)挖掘与知识发现(xian),推动中国传统文化与现(xian)代科技的融合创(chuang)新。

AI应用背后(hou):不只是硬(ying)科技,更有人情味

除了古籍修复之外,以扫(sao)描全能王(wang)“智(zhi)能高清滤镜”为代表的AI技术(shu)正(zheng)被越来越广(guang)泛地应用在日常生活中:有人用它保存(cun)半个世纪前的家书(shu),有人用它观察微雕(diao)艺术(shu),有人用它还原(yuan)家里的“老古董”字(zi)画、旧(jiu)报纸……世界人工智(zhi)能大会现(xian)场,合合信息展示(shi)出(chu)了五花(hua)八(ba)门的AI应用背后(hou)不只是“硬(ying)核”技术(shu),也有丰富温暖的“人情味”。

“我最亲爱的儿子,好好保养(yang)身体,苦(ku)心求学……父在今年精(jing)神很健康,惟愿我儿在外专事(shi)业务,力求实际……”世界人工智(zhi)能大会期间,一份(fen)尘封半个世纪的家书(shu)引起了参观者们的驻足。1956年,一位父亲从(cong)陕(shan)西大荔给在西北工业大学求学的儿子寄出(chu)了这封信。薄薄的宣纸,满载着长辈(bei)对孩子的爱意,以及对于青年一代学成报效祖国的期许。这份(fen)情感被扫(sao)描全能王(wang)“高清”收录,文件不用再继(ji)续遭受岁月的侵蚀,也能让(rang)更多人看见;科技的发展,让(rang)家国情怀实现(xian)了永恒的延续。

扫(sao)描全能王(wang)“智(zhi)能高清滤镜”扫(sao)描20世纪50年代的家书(shu)。

在扫(sao)描全能王(wang)“智(zhi)能高清滤镜”展区,参观者在使用滤镜提升图(tu)像清晰度后(hou),可(ke)从(cong)4厘米长的核桃上提取一组微雕(diao)文字(zi),每(mei)个字(zi)仅有1毫米长。“山高月小,水落石出(chu);清风徐来、水波不兴。”这就是我们耳熟能详的“核舟记”,新时代下“核舟记”蕴含的精(jing)巧、细致之美,正(zheng)在被AI以另一种方式续写。

扫(sao)描全能王(wang)识别(bie)核桃上的微雕(diao)文字(zi)。

此外,为了让(rang)参观者更好地体验(yan)移动端扫(sao)描的便利,展区还摆放了国画、斑(ban)驳的旧(jiu)报纸等(deng)材(cai)料,经过扫(sao)描全能王(wang)“智(zhi)能高清滤镜”处理后(hou),阴影、折痕等(deng)干扰物被一“扫(sao)”而(er)空(kong),画面颜色(se)被算(suan)法智(zhi)能还原(yuan),留下的是色(se)彩(cai)鲜明、版面平整、清晰美观的“收藏级(ji)”电子文档。

AIGC技术(shu)支撑(cheng),扫(sao)描全能王(wang)实现(xian)“所得超所见”

优质的画面处理效果(guo)、精(jing)准(zhun)的文字(zi)提取功能背后(hou),AIGC技术(shu)是卓越的“功臣”。本次大会上,扫(sao)描全能王(wang)集中展示(shi)智(zhi)能高清滤镜、照(zhao)片高清修复、扫(sao)描件文字(zi)编辑(ji)、智(zhi)能擦除等(deng)典型的AIGC相关功能。

据介绍,通过融合生成式AI技术(shu),扫(sao)描全能王(wang)具备了优秀(xiu)的图(tu)像增强能力,快速学习多种文档的图(tu)像特征,可(ke)智(zhi)能修复图(tu)像、去除噪声、优化颜色(se)等(deng),使图(tu)像更加清晰美观。典型应用如被誉为扫(sao)描“黑科技”的智(zhi)能高清滤镜。

近日,合合信息旗下扫(sao)描全能王(wang)升级(ji)发布了智(zhi)能高清滤镜2.0版本功能。新版本的智(zhi)能高清滤镜利用生成式AI技术(shu)进行(xing)视觉(jue)增强,保持并提高图(tu)像的清晰度,让(rang)AI辅助人类思考,一键解决模糊、阴影、透字(zi)、褶皱、污渍、颜色(se)不均、角度倾(qing)斜、形变、摩尔纹等(deng)数十种问题。

在现(xian)场,参观者可(ke)以尝试(shi)在背光的情况下,扫(sao)描透字(zi)的作业本。可(ke)以看见,扫(sao)描页面的清晰度显著增强,老师线上批改作业不用再担心画面过暗、模糊、阴影、透字(zi)等(deng)问题。

扫(sao)描全能王(wang)“智(zhi)能高清滤镜”处理文档透字(zi)、手指、阴影,并进行(xing)清晰度增强(右图(tu))。

在实际应用场景(jing)中,人们除了会遇到环境、拍(pai)摄角度等(deng)外力原(yuan)因带来的扫(sao)描障碍,文档本身存(cun)在的透字(zi)、页面模糊、清晰度不足等(deng)“不可(ke)抗力”也会影响扫(sao)描的效果(guo)。比如尘封已久(jiu)的资料,褶皱的文档会让(rang)文字(zi)变得模糊不清;热敏(min)纸上逐渐褪色(se)的文字(zi),即使用户反复调整拍(pai)摄角度和滤镜,也无法获得清晰的扫(sao)描效果(guo)。

智(zhi)能高清滤镜2.0一键处理阴影、褶皱、水渍、脏污等(deng)多种问题。

智(zhi)能高清滤镜2.0助力多方向(xiang)文字(zi)提取。

据扫(sao)描全能王(wang)事(shi)业部产品总(zong)监许昌(chang)华介绍,为了提升场景(jing)兼容性,扫(sao)描产品除了要做到“所见即所得”的还原(yuan)度,对于图(tu)像质量低下的文件,还要通过科技手段,实现(xian)“所得超所见”。在生成式AI技术(shu)的支持下,扫(sao)描全能王(wang)智(zhi)能高清滤镜2.0版本具备优秀(xiu)的图(tu)像增强能力,显著提升图(tu)像清晰度,用户只需点击拍(pai)摄按钮,便可(ke)自动生成一张如原(yuan)稿般清晰平整的图(tu)片。

在AIGC技术(shu)的加持下,扫(sao)描全能王(wang)还可(ke)以文档内容进行(xing)深度理解,提高产品对不同类型图(tu)像的识别(bie)能力,在实际场景(jing)中根据文档特性,进行(xing)场景(jing)化的判断(duan)与处理,为用户提升信息的存(cun)储与检索效率奠定了基础,如“扫(sao)描件文字(zi)编辑(ji)”功能,从(cong)“增、改、删(shan)”三(san)个方面解决用户在合同、报告、作业等(deng)文档图(tu)片中存(cun)在的修改痛点,让(rang)用户无须受制于细微的调整而(er)耽(dan)误项目的进度。

扫(sao)描全能王(wang)的另一项重点功能是“照(zhao)片高清修复”。该功能可(ke)修复老照(zhao)片上的破损之处、折痕、人脸细节,并通过AIGC算(suan)法对照(zhao)片区域的上色(se)需求进行(xing)研判,对照(zhao)片中的室(shi)内外环境细节及颜色(se)进行(xing)还原(yuan),使得修复效果(guo)更自然。

此外,产品还上线了“智(zhi)能擦除”功能,让(rang)用户只需简单涂抹即可(ke)擦除图(tu)中杂物,根据背景(jing)特性,无痕填充(chong)被擦除的区域,使得擦除杂物后(hou)的照(zhao)片看起来更自然。

14年打磨,练就文档处理“超能力”

从(cong)拍(pai)照(zhao)扫(sao)描、提取文字(zi),到智(zhi)能高清滤镜实现(xian)“所得超所见”的背后(hou),是扫(sao)描全能王(wang)团(tuan)队在文档处理领域长达14年的积累(lei)。

2009年,中科院博士镇立新推出(chu)名(ming)片全能王(wang),凭借着“手机相机拍(pai)摄名(ming)片,自动完成识别(bie)、裁剪(jian)、归档”等(deng)功能,一炮而(er)红。次年,扫(sao)描全能王(wang)于上线,让(rang)价格接近万元的扫(sao)描仪逐渐被手机里的软件替代。

回顾过去十多年间,扫(sao)描技术(shu)在中国普(pu)及率极大增强,实现(xian)了从(cong)“移动化”到“智(zhi)能化”的飞跃性进阶(jie),其中离(li)不开扫(sao)描全能王(wang)团(tuan)队的无数次功能迭代。

据统计,过去的十多年里,国内外市场上曾出(chu)现(xian)超过上千个文档扫(sao)描类产品,2010年上线的扫(sao)描全能王(wang)是最早将扫(sao)描技术(shu)应用于手机等(deng)移动端的APP之一,用户遍及200多个国家和地区,至今仍在多项工具类、商务类APP榜单中保持着第一的排名(ming),为3亿用户带去便利。

“基于过去十多年的技术(shu)和数据积累(lei),我们对于产品能够引领行(xing)业进步(bu)是非常的有信心的。”

“首(shou)先技术(shu)方面是我们始终(zhong)会大力投入保持领先,其次在技术(shu)发展的过程(cheng)中,我们最关注的还是用户碰到的问题,以及使用体验(yan)中不满意的地方。”扫(sao)描全能王(wang)总(zong)经理曹超阳介绍称,技术(shu)突破和用户使用痛点、需求场景(jing)的更新是扫(sao)描全能王(wang)产品持续升级(ji)的方向(xiang)。

采写:南都记者 马宁宁 发自上海

发布于:广(guang)东省
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7