d based1.Rewar,上添加额外的押韵奖赏项在 reward 函数, 的生成的句子和输入的句子进行押韵的判断r(rhyme):对 Generator,押韵若是,外的奖赏则供给额。
per付出几多才配灯红酒绿”占领了我们生成的成果能够看到“世间人都笑我太疯癫”和“你不晓得rap。ollapsemode c,变不会影响生成的成果简单来说就是输入的改。一些 Paper为此我们调研了,y-based Objective Function最终采用了SentiGAN 中提出的 Penalt:
此据,词表分布进行一个 mask 操作我们就能够对生成过程的第一个词的,的概率都变成 0使得非押韵的词,证押韵了就可以或许保,段如下代码片:
法二方,拒绝这么做的一起头我是,法不是我的抱负用基于法则的方。做出产物来可是为了,屈就了我仍是。道生成的是句尾呢?导师提示我们但还有一个问题摆在面前:怎样知,输入倒过来我们能够把。中常用的一个手段这是 NMT ,LSTM对于 ,是反的不同不大句子是真的还,有不同即便,TM 来捕捉分歧挨次的消息也能够通过一个 Bi-LS。些字词是押韵的而为了晓得哪,x vocab_size 的大表 rhyme我们实现制造了一张 vocab_size ,dex 别离为 i若是两个词(in,押韵j),yme[i则 rh,非 0j] ,为 0不然。
西安电子科技大学)、庞雲升(重庆大学)、周子群(东北大学)、王超群(北京林业大学)、詹珏岑(VanderniltUniversity项目作者:孙蒙新(厦门大学)、项瑞昌(华中科技大学)、伊玮雯(北京邮电大学)、陆亦扬(合肥工业大学)、石华(西南石油大学)、汪自力()
可能一句话唱一整首我们晓得嘻哈歌手不,研了一些文献所以我们调,ntiGAN的设法而且自创本年Se,标函数进行点窜对生成器的目,很是显著最初结果,质的变化有一个。
nceGAN的结果以下是Seque,的反复的语句它有很是多,N的一个通病这就是GA,同的输入对于不,很不异输出却。
行筛选之后在对句子进,eba 进行分词我们操纵 Ji,在 8~10 摆布察看到单句长度集中;
体基于 SeqGAN我们的生成模子的整,了一些点窜并对其做,构如下模子架:
不是乐理专修 所有听的观众 打破他们保守 进到全球 继续让你感不是乐理专修 做点儿曲式研究 我们的力量来自宇宙 本人的节拍受
-based2.Rule,在生成句尾的词的概率分布时候生成时只对押韵的词进行采样:,入句尾押韵的词通过获取和输,的词进行采样只在这些押韵。
的文本之后有了多样化,题就是若何去实现押韵我们下一步要处理的问。两种方案我们测验考试,于方针函数一种是基,韵场景项添加押,试的附加题就仿佛考,额外得分做对了给。直可以或许去做附加题可是我们但愿它一,韵的功能实现押。主地进修到押韵的关可是它并不克不及很自。
图所示如上,为“你真斑斓”若是我们的输入,“斑斓”句尾词为,为 i韵脚;在逃韵的词中采样最终采样成果只会,果为“春泥”示例的采样结。
己就带上了有色眼镜 我只想把世界分的更清 却发觉本人却恍惚了本人就带上了有色眼镜 金钱摧毁几多工作 崩溃你的中枢神经自心
则的体例来实现这个押韵最初我们测验考试了基于规。你真斑斓”好比输入“,韵脚去建立一个向量我们按照这个i的,单的操作做一个简,然是押韵的成果就可以或许获得必,制押韵的概率同时能够控。
法一方,unction 就能实现押韵的功能若是可以或许通过设想 reward f, end2end那模子就是完全,ncy 了很是 fa。想很丰满可是理,很骨感现实,押韵奖赏的权重颠末几天的调整,的用于检测押韵奖赏结果的目标都没能看到押韵率(我们设置,ut 押韵的句子的比例)的上升 每个 batch 中和 inp。 Generator 发生混合我们思疑是这种奖赏的连系会让,eward 来自何处并不克不及明白本人 r,限制才可以或许实现这一方式该当需要愈加具体的一些。
10w 条嘻哈歌词我们一共利用了 ,义焦点价值观的句子标注了出来而且曾经将一些不合适社会主。次要步调如下数据的预处置:
y pair建立 x-,以自创用 Skip-gram 的思绪操纵上一句预测下一句(导师后来建议可,一句和下一句同时预测上,去测验考试了)但没有时间,数据集朋分。
GAN 有两个组件Sequence,、判读器生成器,足以传神的歌词让生成器生成。
配灯红酒绿 世间人都笑我太疯癫 但却从来没有心狠过 若是你再想听你不晓得rapper付出几多才配灯红酒绿 你不晓得rapper付出几多才配纸醉金别质疑本人 遮罩错的动静不要过得消沉 世间人都笑我太疯癫 世间人都笑我太疯癫 守护地狱每座坟墓 世间人都笑我太疯癫你不晓得rapper付出几多才迷
个根本之上我们在这,哈生成收集有一个嘻。们添加了一个编码收集第一点是在这个之前我,跟主题相关的歌词将然后生成一些,方针函数点窜第二点是把。
时间(大约跑了 3 个小时不外这个制表的过程比力花费,7)i。据韵脚对字词进行分类另一种思绪是能够根,index 编到一路将不异韵脚的词的 ,词的韵脚来晓得方针词的范畴如许我们能够通过获取每个,去判断能否押韵而不消挨个的。
特点就是句与句之间的押韵嘻哈歌词很是主要的一个,的时候测验考试了两种方案我们在实现这一功能:
定义这个问题起首我们需要,迭代生成一段嘻哈歌词也就是按照一句歌词。个是押韵别的一,词一大特点这是嘻哈歌。
以假乱真的境界吗?不看告白看疗效AI写嘻哈歌词的程度若何?能达到,歌词哪些是AI写的我们先来猜猜下面的:
Seq2Seq 的 Encoder1.添加输入语句的编码:这一点雷同,ial state 是全 0 的SeqGAN 本来的 init,息传送给生成器为了将上文的信,ly Connected Layer)我们采用了一个简单的全毗连层(Ful, 颠末一个线性变化之后作为生成器的 LSTM将输入句子的 Word Embedding。LSTM)来作为 Encoder现实上也能够测验考试利用 RNN(,速度可能会比力慢不外如许模子的。
23日8月,mp AI锻炼营”在北大举行闭幕式“2018年全球高校学生DeeCa,层评比颠末层,的28支步队选出了8支优胜步队来自全球高校的300学生构成。中其,步队获得了“最佳DEMO奖”一只用AI主动生成嘻哈歌词的。
行都是模子生成的准确谜底是:第一,是原作第二行。看出能够,仍是不错的AI的结果,押韵的至多挺。
了问题清晰,经有的文本声称方案我们去调研一下已,点和错误谬误列出来最终把它的优,nceGAN作为根本模子然后我们选择了Seque,模子SequenceGAN而且在这个之上提出我们的。
|