MP4 | 视频:h264,1280×720 | 音频:AAC,44.1 KHz,2通道
类型:电子学习| 语言:英文+ .srt | 时长:27堂课(2小时45分钟)| 大小:995 MB
了解如何预处理文本数据并构建主题建模,文本摘要和情感分析应用程序
您将学到什么
学习Python NLTK库
学习NLP的应用程序
学习文本预处理
学习词干,去词法化,语音标记的一部分
学习构建主题建模应用程序
学习构建文本汇总应用程序
学习构建情感分析应用程序
以及更多….
要求
基本的Python熟悉度
Internet连接
学习意愿
描述
文本挖掘和自然语言处理(NLP)是最活跃的研究领域。在将文本数据输入算法之前,对其进行预处理是NLP的关键部分。在本课程中,您将使用自然语言工具箱(NLTK)(它是Python的一部分)来学习NLP。您将学习数据预处理,以使其可用于任何NLP应用程序。
我们将进行文本清理,词干提取,词形去除,部分语音标记以及停止单词删除。本课程与其他课程的区别在于,本课程深入探讨了NLTK,而不是快速地教授所有课程。
本课程共3节。在第一部分中,您将学习NLP的定义及其应用程序。此外,您还将学习如何安装NLTK并了解其组件。
在第二部分中,您将学习NLTK的核心功能及其方法和技术。我们研究了用于预处理文本数据的不同可用算法。
在上一节中,我们将使用上一节中学习的方法来构建3个NLP应用程序。
具体来说,我们将通过开发主题建模应用程序来识别大文本中的主题。我们将确定大型语料库中讨论的主要主题。
然后,我们将构建一个文本摘要应用程序。我们将教计算机总结大文本并总结要点。
最后一个应用程序是关于情绪分析的。Python中的情感分析是一种非常流行的应用程序,可用于多种文本数据。其应用之一是Twitter情绪分析。由于推文是一小段文字,因此非常适合进行情感分析。在最后一个示例中,我们将构建情感分析系统。
最后,我们将NLTK与SpaCy进行了比较,后者是Python中另一个流行的NLP库。这将是一个非常令人兴奋的过程。让我们开始学习。
本课程适合谁:
任何对NLP和文本挖掘感兴趣的人。