这一年,AI技术深刻改变了多个行业,特别是在内容创作领域。AI带来的变革让许多人感到兴奋,同时也引发了一些争议。例如,AI撰写的赞美文案几乎成为了互联网上的信息噪音。
12月初,各大模型纷纷推出了“数学版”,并在随后的评测中展示了它们在数学和物理方面的能力。然而,在人文社科领域,AI的表现却显得相对平淡。新闻工作者担心使用AI撰写新闻会带来假新闻的风险,而人文学者则发现,尽管AI能生成一些文字,但最终仍需自己动手修改和完善。
本文旨在探讨AI在人文社科领域的不足之处,并从加速学习的角度,评估各大模型在这一领域的表现。我们将通过AI解读一篇学术论文,看看各大模型如何处理此类任务。
我们将上传一篇PDF格式的论文,并使用不同的AI工具进行解读。论文题目为《短视频创作中的传统文化对外传播以李子柒为例》,字数约为6000字。我们将对比各个AI工具的解读效果,从而为各大模型绘制一幅“AI画像”。
测试对象包括:Kimi、豆包、Deepseek、ChatGPT 和智谱清言。
首先,我们测试了Kimi。上传论文后,Kimi在几秒钟内完成了解析,并给出了总结。Kimi的总结框架与论文框架一致,逻辑清晰,简洁明了,并且能够自动规避敏感词汇,最后还附上了简短的评论。
豆包在解析过程中表现出色,识别出了约9000字,比实际字数略多。发送prompt后,豆包仅用20秒就完成了解析。与Kimi相比,豆包不仅总结了主要内容,还在引言部分提供了更具体的背景信息,并呈现了论文中的具体例子。此外,豆包还支持对文档局部内容进行AI搜索、解释、翻译和“问问豆包”,提供了更多实用功能。
Deepseek在处理PDF文件时遇到了困难,无论是转换为Word格式还是纯文本格式,都无法正常工作。
ChatGPT也不支持直接处理PDF文件,需要用户提供文档内容。当我们将中文文本提供给ChatGPT时,它在23秒后给出了不错的解读,甚至加入了一些原创内容。然而,ChatGPT也提醒用户需要核查重要信息,以避免潜在错误。
智谱清言在23秒后给出了详细的解读,不仅涵盖了论文的主要观点、结构和价值,还提供了尾注功能,方便用户跳转到具体段落查看引用来源。此外,智谱清言还具备“AI对照”功能,支持引用、改写、解释、总结和翻译。
Kimi能够快速解析文档并给出简洁明了的总结,但对中文的细节处理稍显不足。豆包在字数统计上可能存在误差,但其总结内容更为详细、丰富,且具备多种实用功能。Deepseek在处理敏感内容时可能存在问题。ChatGPT在处理中文内容时表现良好,但需要用户自行核查信息。智谱清言提供的解读更为全面,不仅涵盖主要内容,还提供了详尽的尾注和“AI对照”功能。
从时间成本上看,各款AI模型的耗时相差不大。使用流程包括上传文档、解析文档、输入prompt、等待解读和核查信息。豆包和智谱清言还支持对文档内容的精细化操作。
综合来看,Kimi更偏向于“理工人”风格,擅长数学和推理,但对中文细节处理不够细致。豆包拥有较为完善的AI工具集,功能强大。智谱清言则在中文理解方面表现出色,非常适合辅助写作。因此,在选择AI工具时,应根据个人需求挑选最适合的模型。
尽管存在一些不足,但这些AI工具无疑为普通用户打开了新世界的大门,使得高效处理大量信息成为可能。