首页 > 车圈原创 > 车圈原创 > 谷歌AI破译古籍新巅峰:错误率仅0.56%,准确率媲美人类专家

谷歌AI破译古籍新巅峰:错误率仅0.56%,准确率媲美人类专家

发布时间:2025-11-16 14:04:34来源: 13041198719
11 月 16 日消息,科技媒体 golem 昨日(11 月 15 日)发布博文,报道称谷歌通过其 AI Studio 平台,正测试一款尚未命名的 AI 模型,在破译难以辨认的历史手稿方面已接近人类专家的水平。
 
IT之家援引博文介绍,历史学家 Mark Humphries 使用一套专门开发的基准数据集,系统性地测试了该模型的性能。结果表明,在处理五份高难度历史手稿时,该模型的整体字符错误率约为 1.7%,其中大部分错误涉及标点符号和大小写,而非单词本身。
 
 
 
Humphries 的评估进一步指出,如果排除模糊的标点符号和大小写错误,该 AI 模型的字符错误率将骤降至约 0.56%,相当于每转写 200 个字符才出现一个错误。
 
根据新发现的未知 Gemini 型号转录的奥尔巴尼账簿页面
 
这一惊人的准确度,让其性能足以与从事历史文献转写的专业人类工作者相提并论。此次测试的文档涵盖了 18 至 19 世纪的多种手写风格,其中不乏字迹潦草、拼写错误和语法不一致的复杂样本,进一步凸显了该模型的强大能力。
 
该模型最令人意外的表现,是其超越了简单的文字转写,展现出复杂的推理能力。在处理一份 18 世纪商人的日记时,原文中有一条关于购买糖的记录,仅标记了数字“145”,并未注明计量单位。
 
谷歌的 AI 模型并未直接转写为“145”,而是输出了“14 磅 5 盎司”。研究人员发现,AI 是通过反向计算账本中记录的总价,并结合当时英国的货币(磅、先令、便士)与重量单位关系,才成功推断出这一结果。
 
 
 
尽管初步结果令人振奋,但 Humphries 也强调了当前评估的局限性。由于该模型通过 A/B 测试形式零星出现,系统性地进行大规模测试存在困难,目前仅评估了基准数据集中约 10% 的样本。
 

车圈原创更多>>

新款理想L6完成工信部申报!全能家用增程SUV值得入手吗? 雅马哈劲战125特别版引入赛道元素强化热血感 奥迪Q9内饰发布:比Q7更大 这台“9系旗舰”到底值不值得等? 全新沃尔沃XC60谍照曝光,将于2027年正式亮相 五菱星光L实车正式曝光!中大型家用SUV登场,大六座来了吗? 国轩高科7款新品:固态、钠电、储能齐发 预售39.98万元,浅析小鹏GX定价合不合理 昊铂S600预售20.99万起,4.3秒破百,双腔空悬+四驱 余承东官宣:200万级尊界S800 Grand Design典藏大观,定档6月 曝某传统合资头部豪华汽车品牌开始裁员 占比约8% 路特斯Emira将弃用现有梅赛德斯-AMG与丰田V6引擎! 4月香港MPV市场:中国品牌霸榜,埃尔法跌出前五,释放了什么信号 ­­智界V9上市发布,售价38.98万-51.98万元,重塑MPV高端市场格局 又一国产猎装车来袭,方程豹方程S GT路透图曝光,或第三季度上市! 星途ET5 EXEED OS 3.7.0 OTA重磅推送,全维安全进阶 变大的Smart:精致小车扛不住中国市场的铁拳 智界V9上市发布,售价38.98万-51.98万元,重塑MPV高端市场格局 从DTM经典到“夜光”艺术车,HWA Evo.R成为纽博格林24小时焦点 “锁电”辟谣之外:新能源车最该补的是信任课 大型SUV市场“神仙打架”4月销量榜 1款销量过万 极氪9X第二 绿紫新色炸场!一汽悦意08以轿跑之姿乱入,可谓颜值天花板 2026款海鸥正式上市 比亚迪把激光雷达下放到A00级 「 爱车空间 」大众品牌全球首款支持城市NOA的轿车来了! 1.5T+双电机 凯迪拉克XT5插混版申报图曝光 对标奔驰EQS 雷克萨斯TZ正式发布 破局存量竞争 比亚迪4月销量背后的技术加速度 2026款海鸥6.99万起!比亚迪把激光雷达塞进A00级小车 奥迪 E7X 开启预售 28.98 万起,德系豪华纯电添新将 传统与新贵的分水岭之间,奥迪E7X为豪华纯电定了新基调? 德系底子+城市NOA,上汽大众ID. ERA 5S工信部信息公布