人工智能与历史研究的融合:机遇与挑战
面对日新月异的大语言模型,生成式人工智能在历史研究中的应用引发了广泛讨论。历史学家的态度呈现出两种极端:一种对生成式人工智能不屑一顾,认为其输出的内容不值一提;另一种则积极拥抱大语言模型,认为这是学术研究的未来方向。本文将从多个角度探讨生成式人工智能在历史研究中的作用,以及如何合理利用这一技术。
一、人工智能赋能历史研究
历史学家的工作内容虽然简单概括为读书、思考、写作,但每个环节都涉及复杂的细节。例如,读书环节包括选择读什么、去哪里读、如何读等。随着数字史学的发展,历史研究的复杂性进一步增加,需要构建数据库、进行数据建制等工作。这些复杂性为人工智能的参与提供了空间和想象力。
1. 文本处理与分析:
- 标注史料:人工智能可以协助历史学家标注史料,提高工作效率。
- 查询笔记:通过自然语言处理技术,人工智能可以帮助历史学家快速查询笔记和文献。
- 总结文献主题:自动摘要技术可以快速总结文献的主题,帮助历史学家把握研究方向。
2. 图像处理与分析:
- 电子邮件分析:英国布里斯托大学开发的电子邮件语境发现工具,能够帮助历史学家提取邮件中的关键信息。
- 图像识别:山东大学数字人文实验室发布的文翰边疆古籍大模型,能够处理多种自然语言任务,为相关领域的专家提供支持。
- 多模态处理:最新升级的GPT-4和谷歌公司的Gemini能够处理多模态对象,满足历史学家应对多样性史料的需求。
3. 个性化定制:
- PDF分析器:用户可以在GPT后台建立个性化的应用程序,如PDF分析器,无需编程知识即可实现复杂功能。
- 领域专家:通过上传特定领域的文献,可以让大语言模型成为某一领域的专家,提供更专业的学术支持。
二、人工智能对齐历史学家的工作流程
生成式人工智能的工作原理是对历史学家工作方式的模仿,这使得历史学家可以更高效地开展研究。具体表现在以下几个方面:
1. 历史模拟:
- 战争模拟:通过电子游戏和基于主体的建模,历史学家可以模拟历史事件,获得对历史细节的深入理解。
- 多智能体模拟:斯坦福大学和罗格斯大学的研究团队利用大语言模型模拟人类社区和战争冲突,为历史研究提供了新的视角。
2. 学术互动:
- 人机协作:历史学家可以通过与大语言模型的互动,提出问题并获得反馈,形成良好的学术互动。
- 智能增强:通过提升人工智能素养,历史学家可以实现智能增强,达到人机共生的协助关系。
3. 研究问题设置:
- 明确需求:历史学家需要清楚地向大语言模型交待研究问题的由来、方向和展开等细节,确保研究的有效性。
- 协调工作:历史学家需要关注各项工作的协调,为研究问题注入跨学科的知识背景。
三、人工智能会取代历史学家吗?
尽管生成式人工智能在许多方面表现出色,但目前来看,它还不足以取代历史学家。主要原因如下:
1. 缺乏自主性:
- 无法自主开启研究问题:生成式人工智能还不能自主开启一个研究问题,更不用说开拓全新的研究领域。
- 依赖人类指导:历史学家始终是研究的主导者,人工智能只是辅助工具。
2. 新史料的使用:
- 数字化边界:大语言模型的知识边界是文献数字化的边界,没有被数字化的材料无法被其识别。
- 原创性研究:历史研究的原创性来自对原始文献的解读,大语言模型无法接触新材料,难以完成原创性研究。
3. 实操工作:
- 档案文献整理:文献整理是典型的实操工作,需要历史学家投入大量时间和精力,大语言模型无法独立完成。
- 田野调查与口述访谈:这些工作需要在物理世界中展开,大语言模型缺乏行动力。
四、人工智能参与历史研究实战
为了验证生成式人工智能的实际效果,笔者进行了一个具体的案例测试。通过一张邮票的图片,逐步引导ChatGPT识别邮票上的人物和发行信息。结果表明,通过不断尝试与交流,最终获得了满意的结果。这说明,生成式人工智能的有效使用需要用户将其视为对话的研究助理,通过不断提供新的线索,最终获得准确的信息。
结语
人工智能的发展对人类社会带来了持续而全面的挑战。在历史研究中,生成式人工智能既是一个强大的工具,也是一个需要谨慎对待的技术。历史学家应该保持开放的态度,合理利用人工智能的优势,同时对其结果保持批判性的分析。通过这种方式,历史学家不仅能够提高研究效率,还能在学术上取得更大的成就。最终,人工智能与历史学家的合作将实现双赢的局面。