自然语言处理(NLP)是计算机系统理解人类语言的能力,属于人工智能(AI)的一部分。为了帮助大家更好地学习NLP,我们整理了一份丰富的资源列表,适合初学者和中级学习者。
初学者可以通过两种方法开始学习自然语言处理:传统机器学习和深度学习。这两种方法各有特点,下面是一些资源帮助你入门:
传统机器学习
深度学习
CS 224n 是斯坦福大学开设的一门优秀课程,适合初学者。
《深度学习自然语言处理》 是Yoav Goldberg的一本书,提供了深度学习自然语言处理的重要资源。
Jacob Eisenstein的课程笔记 涵盖了几乎所有自然语言处理方法。
如果你是一名实践数据科学家,你需要以下三种资源: - 快速入门指南 - 了解热门和新趋势 - 定期关注博客文章
快速入门指南/了解热门和新趋势
Otter等人的调查 介绍了深度学习自然语言处理的最新进展。
Young等人的调查 总结了基于深度学习的自然语言处理,并提供了实践建议。
LSTM和RNN基础 的教程提供了关于这些基础概念的详细介绍。
特定问题的方法调查
文本分类 是自然语言处理中的常见任务,可以参考以下资源:
序列标注 包括词性标注、命名实体识别等任务,可以参考以下资源:
机器翻译 是自然语言处理的一大进步,可以参考以下资源:
问题回答
释义、句子相似度或推理
自然语言推理 包括句子相似性、复述检测和自然语言推理等任务,可以参考以下资源:
MS释义语料库和Quora语料库 用于释义检测。
其他领域
语言建模 学习语言的无监督表示,可以参考以下资源:
关系提取 提取句子中存在的实体间关系,可以参考以下资源:
对话系统 是当前热门话题,可以参考以下资源:
文本摘要 和 自然语言生成(NLG) 也是自然语言处理的重要部分,可以参考以下资源:
需要关注的博客
希望这些资源能帮助你更好地学习自然语言处理。如果你有任何问题或建议,欢迎关注我们的博客。我们在这里经常分享资源清单。
https://www.paralleldots.com/text-analysis-apis
你还可以尝试基于自然语言处理的文本分析API。可以阅读有关应该了解的机器学习算法,以便成为数据科学家。
https://blog.paralleldots.com/data-science/machine-learning/ten-machine-learning-algorithms-know-become-data-scientist/
你还可以在此处查看ParallelDots AI API的免费演示。
https://www.paralleldots.com/text-analysis-apis