【LSTM文本生成器】动手写一个自动生成文章的AI，附完整代码我是@老K玩代码，非著名IT创业者。专注分享实战项目和最新行业资讯，已累计分享超1000实战项目！0.前言长短期记忆网络(即LSTM)，是一种经过优化的循环神经网络(RNN)。通过给神经元设置updategate、forgetgate、outputgate，有效地避免参数在长序列传递的过程中，因梯度消失而造成有效历史信息丢失的问题。LSTM的工作原理如下：编写成公式的话，可以写成这样的形式：$\widetilde{c}^{<t>}=tanh(W_c

写一个自动生成文章的人工智能，有完整的代码。

我是@老K玩代码,一个不出名的IT企业家。专注分享实战项目和最新行业资讯，累计实战项目过千！

0. 前言

长期记忆网络(LSTM)是一种优化的递归神经网络(RNN)。通过对神经元设置更新门、遗忘门和输出门，可以有效避免长序列参数传递过程中梯度消失导致的有效历史信息丢失问题。

LSTM的工作原理如下：

如果你写一个公式，你可以把它写成：

$ \widetilde{c}^{ t }=tanh(w_c[a^{ t-1 }，x^{ t }]b _ c)$ gamma _ u=\sigma(w_u[a^{ t-1 }，x^{ t }]b _ u)$ gamma _ f=\sigma(w_f[a^{ t-1 }，x^{ t }]b _ f)$ gamma _ o=\sigma(w_o[a^{ t-1 }，x { t }]b _ o)$ $ c { t }= gamma _ u * wide tilde { c } { t } gamma _ f * c { t-1 } $ $ a { t

关于LSTM的详细情况，建议你参考大神或者我以前的文章。

知识晦涩难懂，用实战项目学习会吸引人的朋友圈签名事半功倍。在这里，老k分享一个有具体应用场景的project ——文本生成器，供大家边学边练。

1. 准备

在启动代码之前，将所需的第三方库逐个导入到项目中：

重要

ttorchimporttorch.nnasnn fromtorch.nn.utilsimportclip_grad_norm_i承担责任的素材mportjieba fro进入各影视世界mtqdmim条件反射porttqdm

torch就产生英语是PyTorch，我们用来搭建循环神经网络会用到的库;
torch.nn是PyTorch下的文件，主要的模型函数都定位对方手机位置怎么弄是从这个文件里获取，为了方便引用，我们把这个库文件命名成nn;
torch.nn.uti促销ls也是PyTorch下的文件，是一些工具函数，我们这里只需要clip_grad_norm_即可;
jieba是众所周知的中文分词工具运营模式；
tqdm是P重点色布偶ython自带的进度条插件工具；

2. 设计类和函数

2.1 词典映射表

我们设计一个叫Dictionary的class类，用来建议单词和索使用引的映射表。

classDictionary(object):def__init__(self):self.word2idx={}self.idx2word={}self.idx=0def__len__(self):returnlen(self.word2idx)defadd_word(self,word):ifnotwordinself.word2idx:self.word2idx[word]=self.idxself.idx2word[self.idx]=wordself.idx+=1

__init__是这个类的初始化方法，包含了两个映射关系表：由单词映射重点色英短到索引的word2idx 以及由索引映射到单词的idx2word，以及索引指针的位置idx；
__len__是这个类的另一个魔术方法，返回当前映射表的长度，也就是这个词典里有多少个不重复单词的数量；
add_word是这个类最核心的方法，通过这个方法，我们可以给映射表里添加新的单词；

2.2助力钱包语料集

我们获取的语料是字符串，需要编码成计算机能运算的数值，才能进行神经网络模型的学习

所以我们设计个Cor左右英文pus的c自己拉开拉链取悦它lass类，专门用经历的句子来把文本数据数值化、向量化。

classCorpus(object):def__init__(self):self.dictionary=Dictionary()defget_data(self,path,batch_size=20):#step1withopen(path,'r',encoding="utf-8")asf:tokens=0forlineinf.readlines():words=jieba.lcut(line)+['<eos>']tokens+=len(words)forwordinwords:self.dictionary.add_word(word)
#step2ids=torch.LongTensor(tokens)token=0withopen(path,'r',encoding="utf-8")asf:forlineinf.readlines():words=jieba.lcut(line)+['<eos>']forwordinwords:ids[token]=self.dictionary.word2idx[word]token+=1
#step3num_batches=ids.size(0)//batch_sizeids=ids[:num_batches*batch_size]ids=ids.view(batch_size,-1)returnids

__init__是Cor直接抒情的诗歌pus类的初始化函数，会初始化一个映射表Dictionary；
get_data是Corpus的核心方法：

step 1: 根据给定的path读取文件里的文本，然后遍历全部文本，把通过jieba得到的分词逐一add_word到词典映射表Dictionary；
step 2: 实例化一个LongTensor，命名为i条件概率ds。遍历全部文本，根据映射表把单词转成索引，存入ids里；
step 3: 根据传入的batch数量batch_size，把ids重构为20行的矩阵。tensor.view游戏名字简单干净是改变张量形状的方法，参数-1表示根据其它维度自动计算该理财产品维度合适的长左右电影度。

2.3 架构L产品STM模型

我们会从torch.nn继承Module类，进行设置，用来训练整个循环神经网络

classLSTMmodel(nn.Module):

def__init__(self,vocab_size,embed_size,hidden_size,num_layers):super(LSTMmodel,self).__init__()self.embed=nn.Embedding(vocab_size,embed_size)self.lstm=nn.LSTM(embed_size,hidden_size,num_layers,batch_first=True)self.linear=nn.Linear(hidden_size,vocab_size)

defforward(self,x,h):
x=self.embed(x)out,(h,c)=self.lstm(x,h)out=out.reshape(out.size(0)*out.size(1),out.size(2))out=self.linear(out)returnout,(h,c)

__init__是LSTMmodel的初始函数，依次初始了以下内容产生英语名词
embed: 通过nn.Embedding初始化一个词嵌入层，用来将映射的one-hot向量词向量化。输入的参数是映射表长度(vocab_size即单词总数)和词嵌入空间的维数(embed_size即每个单词的特征数)
lstm: 通过nn.LSTM助力初始化一个LSTM层，是整个模型最核心、也是唯一的隐藏层。输入的参数是词嵌入空间的维数(embed_size即每个单词的特征数)、隐藏层的节点数(即hidden_size)和隐藏层的数量(即num_layers)
linear: 通过nn.Linear初始化一个全连接层，用来把神经网络的运算结果转化为信息技术2.0单词的概率分布。输入的参数是LSTM隐藏层的节一个鸡蛋的热量点数(即hidden生活大爆炸_size)和所有单词的数量(即vocab_size)
forwa产品生命周期rd定义了这个模型的前向传播逻辑，传入的参数是输入值矩阵x和上一次运算得到的参数营销人员的工作内容矩阵h：
用embed把输入的x词嵌入化；
用词嵌入化一个手机号怎么申请两个微信号的x和上一次传递进来的参数矩生活万岁演员表阵h，对ls如何让女生经常想起你t部分高速公路封闭m进行依次迭代运算，得到输出结果out以及参数矩阵h和c；
将out变形(重构)为合适的矩阵形状；
用linear把out转为和单词一一对应的概率分布。

执行训练

有了上面的基础，我们就可以对我们的模型进行训练了

embed_size=128hidden_size=1024num_layers=1num_epochs=5batch_size=50seq_length=30learning_rate=0.001device=torch.device('cuda'iftorch.cuda.is_available()else'cpu')

我们先设置好训练会用到的参数变量：

embed_size: 词嵌入后的特征数；
hidden_si客户经理ze: lstm中隐层的节点数；
num_layers: lstm中的隐层数解除禁止恶意应用安装量；
n提高情商的书um_epochs: 全文本遍历的次数；
batch_size: 全样本被拆分的batch组数量；一个都别想跑出新手村
seq_length: 获取的序列长促销活动度；
lear客户端是什么ning_rate: 模型的学习率；
device: 设置运算用的设备实例；

corpus=Corpus()ids=corpus.get_data('sgyy.txt',batch_size)vocab_size=len(corpus.dictionary)

接下来，我们通过Corpus的get_d一份炸鸡的热量ata方法，读取客户关系管理题库语料游戏店，并对数据进消费者维护权益投诉电话行必要的预处理

实例一个Corpus类;
用ge一个都别想跑出新手村t_data内容创作工具有哪些方法促销pop手写海报图片，读取目标文件里的文本，并处理成相应的b上线吧华彩少年王一博atches；
获得当前词典映射表的长度vocab_size（这个vocab_size在设计全连接，即单词概率分布矩阵的长度时会用到）；

model=LSTMmodel(vocab_size,embed_size,hidden_size,num_layers).to(device)cost=nn.CrossEntropyLoss()optimizer=torch.optim.Adam(model.parameters(),lr=learning_rate)

这里，我们条件概率经典例题实例了训练需看到蛇了是什么预兆要的完整结构：

model，是模型主体LSTMmodel；
cost，是训练的损失函数，这里我们用交叉熵损失nn.CrossEntropyLoss；
optimize内容创作工具有哪些r，是训练的优化器，这里我们用Adam方法对参数进行优化。

forepochinrange(num_epochs):states=(torch.zeros(num_layers,batch_size,hidden_size).to(device),torch.zeros(num_layers,batch_size,hidden_size).to(device))foriintqdm(range(0,ids.size(1)-seq_length,seq_length)):inputs=ids[:,i:i+seq_length].to(device)targets=ids[:,(i+1):(i+1)+seq_length].to(device)states=[state.detach()forstateinstates]outputs,states=model(inputs,states)loss=cost(outputs,targets.reshape(-1))model.zero_grad()loss.backward()clip_grad_norm_(model.parameters(),0.5)optimizer.step()

这看到梦里还是云霞是什么歌是主循环，呈现了训练的主体逻辑：

states是参数矩阵的初始化，相当于对LSTMmodel类里的(h,这个大佬有点苟 c)的初始看到黄鼠狼什么预兆化；
在迭代器上包裹tqdm，可左右的拼音以打印该循环的进度条；
i客户nputs和targets是训练集的x和y值；
通过detach方法，定义参数的终点位置；
把inputs和states传入model，得到通过模型计算出来的outputs和更新后的states；
把预测值outputs和实际值targets传入cost损失函数，计算差值；
由于参数在反馈时，梯度默认是不断积累的，所以在这里需要通过zero_grad方法，把梯度清零以下；
对l进入路由器设置密码oss进行反向传播运算；
为了避免梯度爆炸的问题，用clip_grad_norm_设定参数阈值为0.5；
用优化器optimizer进行优化.

生成文章

当模型通过上述过程，完成训练后，我们就可以用训练过的模型，自动生成文章了。

num_samples=300

article=str()

state=(torch.zeros(num_layers,1,hidden_size).to(device),
torch.zeros(num_layers,1,hidden_size).to(device))

prob=torch.ones(vocab_size)
_input=torch.multinomial(prob,num_samples=1).unsqueeze(1).to(device)

我们先完成一些初始化的工作：

num_samples表示生成文本的长度；
article是字符串，作为输出文本的容器；
stat进入路由器设置界面e是初始化的模型参数，相当于模型中的重点色英短(h, c)；
prob对应模型中的outputs，是输入变量经过语言模型得到的输出值，相当于此时每个单词的概率分布；
_input，出于和Python自带函数input冲突，在变量明前加下划线_，是从字典里随机抽样一个单词，作为文章开头。

foriinrange(num_samples):output,state=model(_input,state)

prob=output.exp()
word_id=torch.multinomial(prob,num_samples=1).item()

_input.fill_(word_id)

word=corpus.dictionary.idx2word[word_id]
word='\n'ifword=='<eos>'elseword
article+=wordprint(article)

通过主循环，理财是怎么赚钱的实现自动生成文本的功能：

for循环num_sampl游戏名字es次，即可生成由num_samp步骤拼音les个单词组成的文章；
output、state是LST客户经理Mmodel在接收到变量_input和state后的输出值；
prob是对上一步得到的output进行指数化，加强高概率结果的权重；
word_id，通过torch_multinomial，以p信息技术2.0rob为权重，对结果进行加权抽样，样本数为1(即nu理想l9m_samples)；
为下一次运算作准备，通过fill_方法，把最新的结果(word_id)作为_input的值吸引的拼音；
从字典映射产品运营表Diction左右脸不对称如何矫正ary里，找到当前索引(即word_id)对应的单词；
如果获得到的单词是特殊符号(如<eos>，句尾符号EndOfSentence)，替换成换行符；
将word存到article文章容器中；
print生成的文章，将article打印出来。

总结

通过上述方法，就可以让LSTM模型自动替我们生成一些文章文本。

以下是我以《三国演义》为语料，经过一个epoch训练后得到的模型，自动生成的文本：

夏侯渊引项城濬赵云南山。可引军将切齿韦愿往插可借张引兵哨探，—不酿得中，崩寄臣居民而立。奂，降旗转加司徒王允，便赏先主姜维所讫坐定细作，傍若无人兵迎践踏。关公陇来报为兵战为，因小疮大进张飞。

且说可怜何进，正见遂通晓孔明马超亦之孙拜而出波浪袁术。病故入献酒食这，至丙寅日。孔明曰：“之处是朱灵同心？”操曰：“张翼德等。时定军山也。吾而定乘他府，蜀兵实为也？死罪相助禳，楮并举良谋乎为即命？问时满宠精兵姜维兵，山坚守殃及，不十合坐者不满火归坐守，选长叹、曹军入从吞并，果是痛饮、护卫军、公当速、众韩关之所学门、质入彪，只得三万，跃起潘隐谓，肩同归中。鼓噪托病赵彦杀，三声已危数十字子翼，杀入破绽飞乃入，皆创立大半六年人口。左右军，皆不能使人往去
关公横截樊城。众军击班者黄门其肉都督隆冬事截杀。忽起凋残营寨。望此不到别船刺臂，今卓齐自于所舵，然后虎豹曰：“兄为何人，秋天追夺术之功，乃大魏听令经典，不忧姜维归之今蜀兵名将。今晚之精兵。”荆棘甚妙之。允曰：“吾与将军归家好以此？”遂夏侯拜谢扬妻女而。两阵徐州惰慢兵。操大惊，引曹洪领进酒具言前，不觉两军两军会小校，坛自守。操曰：“何不同在关某！”分付平：“此医与文长阴平探其防护以金帛同扶。”

黄忠孙先锋齐声见山谷，军吏小匣冬投百步成万。彧魏军曰：“贵人为红旗来！”武士膂力过人颈曰：“各引东方之心休道，献深感而相府石，使子分外将矣，难芳引路。”后人知事美髯与允并素闻密授而去。

建安荀彧改正引路。正是校尉造饭陆口守豫州动，貂蝉蒯越曰：“三处，良苦汉高祖；今不能成大功草芥，俱杀此人，安出城之辱不得、投；岸去李辅围为此如，怎敢以三人部麾抚慰矣。”孔明曰审钧意冒死慌救入引兵。布苏，壮士利斧从江众之，娱情以赐赞徐往吕旷去，班部艾。华阴羕。禳欲攻亮出受敌。偿命之，兵败将亡汉中披挂。

且说至，邓艾自大半不分昼夜至。

需促销活动要语料的可以私步骤的英文信我关键词 / RNN / 领取。

通过上面的例子，我们可以发现，仅仅通过一层神经网络，一轮epoch的训练，就能生成一段似是而非的文章。

我们可能可以通过以下方法进一步优化产出文要求员工发手机电量图本的结果：

调整模型内容，如将LSTM替换成GRU，或者替换损失函数和优化器；
增加词嵌入的特征表示embed_size，使每个单部分高校缩减国庆假期词能包含更多信息，提高计算结果营销人员的精准度；
提高LSTM神经元数量hidden_size或隐藏层数num_layers，以起到优化模型逻辑的作用；
增加训练次数，如增加num_epochs，使模型继续向最优理财产品排行哪个好解收敛；
调整增大seq_length的值，使训练传入的语句步骤流程图变长，增加前后词语的长距离依赖关营销是什么系和准确性；
修改学习率learning_ra上线检车多少钱te，通过不同的步长使梯度下降的过程更有效；
使用语法更规范，文本量更大的语料进行训练。

以上方法不一定会为模型进入bios带来更时候的拼音是轻声吗优的结果，还存在过度拟合或者其它问题的情况，各位可以根据代码，自行尝试和优化。

希望大家能基于本项目，制作出优秀的文本生成器。

免责说明

本站资源大多来自网络，如有侵犯你的权益请提交工单反馈（点击进入提交工单）或给邮箱发送邮件laakan@126.com 我们会第一时间进行审核删除。站内资源为网友个人学习或测试研究使用，未经原版权作者许可,禁止用于任何商业途径！请在下载24小时内删除！

点击解锁VIP可享全站免费下载	零基础搭建绿幕直播间卖货赚钱	闪豚AI训练★批量生成原创好文章	本广告位待租本广告位待租待租
点击解锁VIP可享全站免费下载	零基础搭建绿幕直播间卖货赚钱	高质量SEO原创文章生成☆过AI检测	本广告位待租本广告位待租待租
点击解锁VIP可享全站免费下载	零基础搭建绿幕直播间卖货赚钱	NLP原创SEO文章AI自动生成教学	本广告位待租本广告位待租待租
温馨提示：需广告位请联系广告商务经理

{{userData.name}}已认证

在线写小说自动生成器，「LSTM文本生成器」动手写一个自动生成文章的AI，附完整代码

0. 前言

1. 准备

2. 设计类和函数

2.1 词典映射表

2.2助力钱包语料集

2.3 架构L产品STM模型

执行训练

生成文章

总结

pdf查看软件哪个好（安卓手机pdf阅读器排行）

xbox手柄驱动安装教程（win10安装xbox驱动的作用）

脑办公软件基础知识教程（新手自学办公软件推荐）

电脑关机慢怎么回事（电脑关机慢怎么解决方法）

来看

关于来看

投稿须知

版权声明

广告服务

{{userData.name}}已认证

0. 前言

1. 准备

2. 设计类和函数

2.1 词典映射表

2.2助力钱包 语料集

2.3 架构L产品STM模型

执行训练

生成文章

总结

相关文章：

抖音养号怎么养，抖音怎么养号步骤？抖音养号需要注意哪些？

别人抢了你的劳动成果，谈一谈工作上被他人抢功该怎么办

灵感词语随机生成器，免费查找敏感词检测，替换敏感词，橙瓜码字助你过审核

写小说的灵感素材，网络小说武器资料素材，橙瓜码字写作素材库，让你码字时轻松获取

pdf查看软件哪个好（安卓手机pdf阅读器排行）

xbox手柄驱动安装教程（win10安装xbox驱动的作用）

脑办公软件基础知识教程（新手自学办公软件推荐）

电脑关机慢怎么回事（电脑关机慢怎么解决方法）

来 看

关于来看

投稿须知

版权声明

广告服务

2.2助力钱包语料集

来看