【深度学习教程】Python 如何用 LSTM 做情感分析？小白也能上手！

【深度学习教程】如何用 LSTM 做情感分析？小白也能上手！

Hello 大家好，今天我们来聊一个超热门的话题——LSTM 网络在情感分析中的应用！想象一下，通过深度学习，你的代码可以读懂人类情绪，知道“我爱你”和“我讨厌你”的区别，是不是很酷？今天这篇文章，我会手把手教你从零开始，用 Python 和 Keras 实现一个基于 LSTM 的情感分析项目，新手小白也能看得懂！

LSTM 是深度学习里的一位“长跑选手”，尤其擅长处理文本序列数据，像语音识别、机器翻译、文本生成这些领域，它都能大显身手。这篇文章我会带你了解：

LSTM 网络的基础原理；
如何用 LSTM 搭建情感分析模型；
数据预处理、训练和评估的完整流程。

一、LSTM 是什么？为什么它适合情感分析？

先来点“基础知识补课”。
LSTM，也就是 Long Short-Term Memory，是一种改良的循环神经网络（RNN）。普通的 RNN 很容易在长序列数据上“记不住”之前的信息，比如说，它看到了一句小说的前半段，但后半段完全忘了上下文。LSTM 的厉害之处在于它的结构——遗忘门、输入门和输出门——可以让它有效地保留长期记忆，还能屏蔽无关信息。

而情感分析呢，本质上就是一类序列数据的分类问题：从一段文本里分析它是正面的还是负面的情绪。LSTM 擅长处理这种数据，因为它不仅能记住单词，还能理解单词之间的关系和上下文含义。

二、我们要实现什么？情感分析项目概述

在今天的项目中，我们会用 Keras 这个深度学习框架，基于一个叫做 IMDB 数据集 的经典数据集，搭建一个简单的 LSTM 模型。IMDB 数据集包含 50,000 条电影评论，每条评论都被标记为正面（1）或负面（0），这正好是我们情感分析模型的理想训练素材。

项目的主要步骤：

数据加载与预处理：将文本数据转换为机器可读的格式；
LSTM 模型构建：设计一个简单的 LSTM 网络；
模型训练与验证：让模型“学习”这些数据；
模型评估与预测：检查模型效果并用它进行情感预测。

三、项目环境准备

在正式开始之前，我们需要确保环境里安装了必要的工具。所需的库如下：

TensorFlow：主框架，Keras 集成在其中；
numpy：用于数组处理；
matplotlib（可选）：用来画训练曲线。

安装命令：

pip install tensorflow numpy matplotlib

安装好之后，我们就可以开整啦！

四、加载和预处理数据

在深度学习中，数据处理是第一步，也是最重要的一步。我们直接用 Keras 提供的 IMDB 数据集，它已经帮我们完成了分词和编号的工作，非常方便。

加载数据集

from tensorflow.keras.datasets import imdb
from tensorflow.keras.preprocessing.sequence import pad_sequences

# 定义参数
max_words = 10000  # 只保留数据集中最常见的 10,000 个单词
max_len = 200  # 每条评论截断或填充到 200 个单词

# 加载数据集
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_words)

print(f"训练集样本数: {len(x_train)}, 测试集样本数: {len(x_test)}")

数据预处理

IMDB 数据集的每条评论已经转换成了一个整数序列，每个整数对应一个单词。我们需要将这些序列统一填充到 200 个单词的长度，这样才能输入到 LSTM 模型中。

# 填充序列
x_train = pad_sequences(x_train, maxlen=max_len)
x_test = pad_sequences(x_test, maxlen=max_len)

print(f"填充后的训练数据形状: {x_train.shape}")

五、构建 LSTM 模型

网络架构

LSTM 模型的核心是：

嵌入层（Embedding Layer）：将整数序列转换为稠密向量；
LSTM 层：学习序列数据的特征；
全连接层（Dense Layer）：生成分类结果。

代码实现

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense

# 定义模型
model = Sequential([
    Embedding(input_dim=max_words, output_dim=128, input_length=max_len),  # 嵌入层
    LSTM(128, dropout=0.2, recurrent_dropout=0.2),  # LSTM 层
    Dense(1, activation='sigmoid')  # 输出层
])

# 编译模型
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

# 输出模型结构
model.summary()

这个模型结构相当紧凑，非常适合新手入门。

六、训练模型

我们定义训练的超参数：

batch_size = 64：每次输入到模型的样本数；
epochs = 5：训练的迭代次数。

开始训练：

history = model.fit(
    x_train, y_train, 
    batch_size=64, 
    epochs=5, 
    validation_split=0.2  # 20% 的训练数据用作验证集
)

训练完成后，Keras 会返回一个 history 对象，记录了每个 epoch 的训练损失和准确率。

七、评估模型

训练完成后，我们可以在测试集上检查模型的表现。

# 在测试集上评估
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print(f"测试集准确率: {test_acc:.4f}")

如果测试集准确率超过 85%，说明模型已经表现不错啦！

八、预测新评论的情感

模型训练完成后，我们可以用它对新评论的情感进行预测。假设我们有一条新评论：“The movie was fantastic and the acting was superb!”

预测代码：

from tensorflow.keras.preprocessing.text import Tokenizer

# 定义新评论
new_review = ["The movie was fantastic and the acting was superb!"]

# 将评论转为序列
tokenizer = Tokenizer(num_words=max_words)
tokenizer.fit_on_texts(new_review)
new_review_seq = tokenizer.texts_to_sequences(new_review)

# 填充序列
new_review_pad = pad_sequences(new_review_seq, maxlen=max_len)

# 预测情感
prediction = model.predict(new_review_pad)
print(f"情感预测: {prediction[0][0]:.4f}，(0 为负面，1 为正面)")

模型会输出一个概率值，接近 1 表示正面情感，接近 0 表示负面情感。

九、项目优化建议

使用双向 LSTM：通过双向 LSTM 同时捕捉前后文信息。
引入预训练词向量：例如 GloVe，可以让模型更好地理解单词含义。
增加数据增强：通过同义词替换、反义词生成等方法增加训练数据。

双向 LSTM 的代码示例：

from tensorflow.keras.layers import Bidirectional

model = Sequential([
    Embedding(input_dim=max_words, output_dim=128, input_length=max_len),
    Bidirectional(LSTM(128, dropout=0.2, recurrent_dropout=0.2)),
    Dense(1, activation='sigmoid')
])

十、总结与展望

在本文中，我们从零开始实现了一个基于 LSTM 的情感分析项目，从数据预处理到模型训练和评估，覆盖了完整流程。这仅仅是情感分析的入门，未来你还可以探索更多高级技术，例如注意力机制、BERT 等预训练模型。

如果你觉得这篇教程对你有帮助，不要忘了点赞收藏！有任何问题也欢迎在评论区讨论，我们下期再见啦～

posted @ 2025-01-16 17:14 程序员徐公阅读(277) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· Python 基于BERT+LSTM的情感分析

· Python 网络舆情分析系统，舆论可视化界面

· 情感分析新手实践

· 基于深度学习的文本分类案例：使用LSTM进行情绪分类

· PyTorch 人工智能研讨会：6~7

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗？
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句：使用策略模式优化代码结构

历史上的今天：
2024-01-16 IntelliJ IDEA 2024年最新下载、激活教程、亲测可用

2025年3月

日

一

二

三

四

五

六

公告

昵称：程序员徐公
园龄： 8年7个月
粉丝： 27
关注： 1

+加关注

随笔分类

Python 教程(5)

gdutxiaoxu