专访美国工程师:我如何用AI续写《权力游戏》第六部小说_最新动态_新闻资讯_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 新闻资讯 > 最新动态 > 专访美国工程师:我如何用AI续写《权力游戏》第六部小说

专访美国工程师:我如何用AI续写《权力游戏》第六部小说

 2017/9/7 13:09:05    程序员俱乐部  我要评论(0)
  • 摘要:腾讯科技纪振宇9月5日硅谷报道让许多人翘首以盼的热门美剧《权力游戏》第七季刚刚播出完毕,粉丝们大呼过瘾的同时,已经迫不及待下一季的尽快播出。然而可能要让很多人失望的是,权力游戏的最终一季的面世,可能一直要等到2019年的春季。实际上,这部根据小说改编的热门美剧作品,从第七季开始,编剧的进度已经超越了原小说作者。小说作者GeorgeR.R.Martin为这部宏大的作品总共构想了7部,他目前只完整完成了前5部,从2011年开始,第6部小说的进度基本陷入停滞,直到现在也并没有具体的出版时间
  • 标签:游戏 美国 工程师

  腾讯科技纪振宇 9 月 5 日硅谷报道

  让许多人翘首以盼的热门美剧《权力游戏》第七季刚刚播出完毕,粉丝们大呼过瘾的同时,已经迫不及待下一季的尽快播出。

  然而可能要让很多人失望的是,权力游戏的最终一季的面世,可能一直要等到 2019 年的春季。

  实际上,这部根据小说改编的热门美剧作品,从第七季开始,编剧的进度已经超越了原小说作者。

  小说作者 George R.R. Martin 为这部宏大的作品总共构想了 7 部,他目前只完整完成了前 5 部,从 2011 年开始,第 6 部小说的进度基本陷入停滞,直到现在也并没有具体的出版时间,这也让权力游戏最终一季上映时,小说可能还没有完成成为了大概率事件。

  原作者的慢节奏让众多粉丝们早已按耐不住,他们在各个粉丝群和讨论区里开始就剧情未来的发展、最终结局等展开了广泛讨论和猜测。

  来自美国科罗拉多州的工程师 Zack Thoutt 也是众多权力游戏迷中的一员,与许多人一样,他也等不及小说的出版。

  近日,他突发奇想,通过人工智能技术,来续写权力游戏的第六部小说作品。

  目前,Thoutt 已经将他的人工智能系统完成的第六部小说的前 5 个章节公开发表在 GitHub 上,短时间内引来了很多关注。

(Zack Thoutt 发布在 GitHub 上的用人工智能系统写出的权力游戏第六部的前 5 章)

  许多人评价称,人工智能写出的这部完全还不存在的作品,虽然存在很多瑕疵,但在很多叙事的逻辑、可能的情节发展方面,很多都说的通。

  一位在 GitHub 上用户名为 xorinzor 的用户评价说,“这一定是我在很长时间内读到的最好的东西,很喜欢。”

  HackerNews 的一位名叫 SwellJoe 的用户表示,“RNN (卷积神经网络)得出的结果似乎与目前最主流的粉丝们的理论相一致,即詹姆和瑟曦之间将发生的事,所以看起来并不是完全不着边际。”

  Reddit 上名为 CinnamonJ 的用户评论说,“无论你们怎么评价这个系统结果,它在试图编写一个开放式结局!”

  在 5 日接受腾讯科技采访时,Thoutt 表示,自己从高中时期便喜欢上了权力游戏这部作品,他首先看了权力游戏的第一季电视剧集,然后找来了原著小说,一口气读完,从此便成为了这部作品的粉丝。

  “对于小说和电视剧我并没有特别的偏好,我认为两者都很棒。”Thoutt 说。

用人工智能系统写的权力游戏第六部部分文字节选

  在自我介绍时,Thoutt 对腾讯科技表示,自己过去学习的是应用数学专业,曾担任一家软件公司的数据科学家,目前则是一名全栈工程师。

除了工作时间以来,Zack Thoutt 热爱户外运动

  在谈到如何想到用人工智能来写第六部作品时,Thoutt 说,他最近刚刚完成了 Udacity 的在线深度学习基础课程,了解到了一些擅长于生成序列性文字的神经网络类型,当权力游戏的第七季刚刚上线播放时,他便产生了为何不用神经网络来写出第六部作品的想法。

  Thoutt 说,他所采用的 RNN (卷积神经网络)特别适合于完成这样的任务,因为该神经网络对序列性数据的处理能力很好,

  “当你用文字来训练 RNN 模型,你需要给每个特殊的词(如人名、地名等)指定一个 ID,然后将这些 ID 的序列输入进 RNN 神经网络中,让他学习这些文字的规律。”

  Thoutt 说,他运用的 LSTM,与其他机器学习算法相比,能够记忆更长期的信息,其本质上仍然属于 RNN,但在处理文字性数据方面尤其好,因为其本身的设计就是为了在序列中记忆有用信息。

  为了训练这一神经网络,Thoutt 将权力游戏前 5 部作品共 5376 页文字信息作为训练数据输入模型中,Thoutt 说,这部世界观庞大的作品大约有 3.2 万个特殊的需要标注为 ID 的词汇,这也让训练工作变得复杂而繁重。

  但他也表示,实际上对于深度神经网络来说,5 部作品的文字量也是非常小的训练数据集,一个更加理想的数据集的规模大约需要是目前数据量的 100 倍。

  数据集的有限实际上也造成了模型最终输出结果并不十分理想,实际上,在神经网络写出的第六部作品中,在之前情节中已经死亡的人,又重新出现。

  HackerNews 用户 SwellJoe 说,至少目前,我不认为 Martin 需要担心来自 RNNMartin 的竞争。言下之意是,神经网络写出的小说,还远远达不到人类的水准。

  Thoutt 说,造成这样的结果的原因是,实际上在之前的情节中,有些人物的死亡并非是简单直白地表达出来,而是根据情节和逻辑所自然推测出来,但这对于人工智能来说,显然理解起来就有难度。

  “作品中情节的上下文让系统难以理解和记忆。”Thoutt 说。

  他也表示,目前他并没有任何能够在这方面改善结果的办法,“也许这需要更加复杂的神经网络结构,或许需要多个神经网络来不断跟踪不同的故事线的进展。”

  “我现在正在着手改善模型,”Thoutt 说,“如果大家希望我用神经网络写更多的章节,我一定会这么做。”

  Thoutt 说,目前他收到的很多来自工程师群体和权力游戏粉丝群体的积极的评价,也让他做这件事的动力更足。

  这件事目前已经在工程师和权力游戏粉丝圈里产生了很多影响,但还没有引起权力游戏制作团队的关注。

  “如果他们(权力游戏制作团队)来找我,那真是美梦成真了。”Thoutt 说。

发表评论
用户名: 匿名