业界动态
专为Excel而生的大模型来了!,数据,处理,工作
2024-07-23 04:47:40
专为Excel而生的大模型来了!,数据,处理,工作

12日,Microsoft发布了(le)一个(ge)新(xin)的大型语言模型,计划为 Excel、谷歌 Sheets 等电子表格应用程序开发全新(xin)的 AI 大语言模型--SpreadsheetLLM。

Microsoft在论(lun)文指出,SpreadsheetLLM作为一款全新(xin)的AI模型,将(jiang)广(guang)泛(fan)使(shi)用于理解并(bing)处理复杂的电子表格数据。

SpreadsheetLLM具(ju)有改变电子表格数据管理和分析的潜力,为更智(zhi)能和高效的用户交互铺平了(le)道路。

SpreadsheetLLM具(ju)有改变电子表格数据管理和分析的潜力,为更智(zhi)能和高效的用户交互铺平了(le)道路。

这或(huo)许会让会计师和数据分析师们(men)对他们(men)的未来工作前景感到担忧。网(wang)友们(men)在社交平台X上调侃,认为“(每(mei)天(tian)与Excel打交道的)凯伦(lun)们(men)的工作很快就会被(bei)人工智(zhi)能取代”。

“凯伦(lun)可能很快就会失业”

研究人员指出,当前的电子表格应用程序功能丰富,在布局和格式(shi)方面为用户提供了(le)大量选择,这使(shi)得传(chuan)统的 AI 大语言模型难以在电子表格处理方面发挥作用。而 SpreadsheetLLM 就是专(zhuan)门(men)为电子表格应用而设计的 AI 模型。

微软还开发了(le) SheetCompressor工具(ju),以帮助 SpreadsheetLLM 更好地理解和处理电子表格数据。

研究人员称,SpreadsheetLLM 的潜在应用非(fei)常广(guang)泛(fan),从自动执行日常数据分析任务,到提供基于电子表格数据的智(zhi)能见解和建议。例如,SpreadsheetLLM 可用于自动生成财(cai)务报(bao)告、识(shi)别数据中的异常或(huo)趋势、为客户提供个(ge)性化的产(chan)品或(huo)服务推荐等。

因此,SpreadsheetLLM 有可能彻底(di)改变企业处理数据的方式(shi)。

一位用户声称:“正如我们(men)所知,能够编写 SQL 的 LLM 将(jiang)扼杀(sha)整个(ge)数据工程行业。”

另一位写道,“SaaS陷入了(le)深深的麻烦。”

“这对金(jin)融界(jie)来说将(jiang)产(chan)生巨大影响”

宾夕法尼(ni)亚大学沃顿(dun)商学院副教授伊桑(sang)·莫利(li)克(Ethan Mollick)在推特上写道:“这再(zai)次表明 LLM 很快就能处理结(jie)构化和非(fei)结(jie)构化电子表格数据。这将(jiang)解锁许多用例(预测、财(cai)务、估值等),并(bing)且拥有电子表格真实来源(yuan)往往会减少幻觉(jue)。”

SpreadsheetLLM如何工作?

SpreadsheetLLM通过将(jiang)电子表格数据编码(ma)为大型语言模型(LLM)可以理解的格式(shi),从而使(shi)LLM能够对电子表格数据进行推理、回答有关数据的问题,甚(shen)至根据自然语言提示生成新(xin)的电子表格。

SpreadsheetLLM的核心是“SheetCompressor”框架,该框架可以有效地压缩和编码(ma)电子表格数据,使(shi)其更易于LLM处理。SheetCompressor由三(san)个(ge)模块组成:

▲基于结(jie)构锚点的压缩:在整个(ge)电子表格中放置“结(jie)构锚点”,以帮助LLM理解数据结(jie)构。

▲逆索引翻译:将(jiang)电子表格转换为更紧凑的格式(shi),并(bing)消除(chu)冗余数据。

▲数据格式(shi)感知聚合:根据数字格式(shi)和数据类型对相邻(lin)单元格进行分组。

▲基于结(jie)构锚点的压缩:在整个(ge)电子表格中放置“结(jie)构锚点”,以帮助LLM理解数据结(jie)构。

▲逆索引翻译:将(jiang)电子表格转换为更紧凑的格式(shi),并(bing)消除(chu)冗余数据。

▲数据格式(shi)感知聚合:根据数字格式(shi)和数据类型对相邻(lin)单元格进行分组。

SHEETCOMPRESSOR 框架的插图(图片:Microsoft)

Microsoft称,SpreadsheetLLM显着提高了(le)电子表格检测任务的性能,在 GPT4 的上下文学习(xi)设置中比普通方法高出 25.6%,使(shi)用词元(token)的成本降低了(le) 96%,并(bing)能提供更好的处理结(jie)果。

目前,Microsoft还没有公布何时向公众发布SpreadsheetLLM 的消息(xi)。该论(lun)文指出,该模型仍有一些限制,如对于复杂或(huo)结(jie)构化程度高的数据,其理解能力仍然有限;SheetCompressor目前还不能压缩包含自然语言的单元格等等。

发布于:上海市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7