so easy!10行代码写个"狗屁不通"文章生成器功能

前几天,GitHub 有个开源项目特别火,只要输入标题就可以生成一篇长长的文章。

背后实现代码一定很复杂吧,里面一定有很多高深莫测的机器学习等复杂算法

不过,当我看了源代码之后

这程序不到50行

尽管我有多年的Python经验,但我竟然一时也没有看懂

这代码放到编辑器里还特么真能执行

当然啦,原作者也说了,这个代码也是在无聊中诞生的,平时撸码是不写中文变量名的, 中文变量名只是最开始瞎写的时候边写语料边写代码时懒得切英文输入法了。

中文变量名也就忍了,但代码逻辑不好懂,最后我还是忍着剧烈的头痛把它的原理读懂了。

这究竟咋实现的呢?

我肯定是不服的,这代码要是被Python之父看见了,他一定后悔发明这门语言。

其实,生成的文章内容都来自于素材文件 data.json, 这个文件的结构是个字典结构

{
 "famous":[
 "爱迪生a,天才是百分之一的勤奋加百分之九十九的汗水。b",
 "查尔斯·史a,一个人几乎可以在任何他怀有无限热忱的事情上成功。b",
 ....
 ],
 "bosh":[
 "现在, 解决x的问题, 是非常非常重要的. 所以, ",
 "我们不得不面对一个非常尴尬的事实, 那就是, ",
 ....
 ],
 "after":[
 "这不禁令我深思. ",
 "带着这句话, 我们还要更加慎重的审视这个问题: ",
 ....

 ],
 "before":[
 "曾经说过",
 "在不经意间这样说过",
 ....
 ]
}

famous 里面收集了很多名人语录, 里面的关键字”a”和”b” 将分别被 beforeafter列表中的内容替换,这样处理后句子看起来具有逻辑性

bosh里面是各种各样的的废话, 里面关键字”x”最后会用标题替换,这样会让人感觉,这篇文章还是和标题有那么一丢丢联系的。

一篇完整的文章就是靠不断随机从famous、bosh列表获取元素,之后拼接成一篇文章。

搞懂了原理,如果我们自己来写的话,除去代码注释,就10来行代码

import random
import json

data = json.load(open("data.json", encoding="utf-8"))

def generator(title, length=800):
 """
 :param title: 文章标题
 :param length: 生成正文的长度
 :return: 返回正文内容
 """
 body = ""
 while len(body) < length:
  num = random.randint(0, 100)
  if num < 10:
   body += "\r\n"
  elif num < 20:
   body += random.choice(data["famous"]) \
    .replace('a', random.choice(data["before"])) \
    .replace('b', random.choice(data['after']))
  else:
   body += random.choice(data["bosh"])
  body = body.replace("x", title)

 return body

来测试一下

from bullshit import generator
content = generator("我爱Python")
print(content)

输出

一般来说, 问题的关键究竟为何? 既然如何,
对我个人而言,我爱Python不仅仅是一个重大的事件,还可能会改变我的人生.
我爱Python, 到底应该如何实现. 生活中, 若我爱Python出现了, 我们就不得不考虑它出现了的事实. 从这个角度来看, 易卜生说过一句富有哲理的话, 伟大的事业,需要决心,能力,组织和责任感。我希望诸位也能好好地体会这句话. 我们不妨可以这样来想: 我们不妨可以这样来想: 奥斯特洛夫斯基曾经提到过, 共同的事业,共同的斗争,可以使人们产生忍受一切的力量。 这不禁令我深思. 在这种困难的抉择下, 本人思来想去, 寝食难安.问题的关键究竟为何? 带着这些问题, 我们来审视一下我爱Python. 我爱Python似乎是一种巧合,但如果我们从一个更大的角度看待问题,这似乎是一种不可避免的事实.
现在, 解决我爱Python的问题, 是非常非常重要的. 所以, 对我个人而言,我爱Python不仅仅是一个重大的事件,还可能会改变我的人生. 现在, 解决我爱Python的问题, 是非常非常重要的. 所以,

这样看来, 在这种不可避免的冲突下,我们必须解决这个问题. 既然如何, 要想清楚, 我爱Python, 到底是一种怎么样的存在. 既然如此, 总结的来说, 经过上述讨论, 我爱Python因何而发生?总结的来说, 就我个人来说, 我爱Python对我的意义, 不能不说非常重大. 而这些并不是完全重要, 更加重要的问题是, 问题的关键究竟为何? 笛卡儿曾经提到过, 我的努力求学没有得到别的好处,只不过是愈来愈发觉自己的无知。这句话语虽然很短, 但令我浮想联翩. 我认为, 我爱Python, 发生了会如何, 不发生又会如何. 经过上述讨论,
在这种困难的抉择下, 本人思来想去, 寝食难安.我爱Python, 到底应该如何实现. 我爱Python, 到底应该如何实现.

你还自定义内容长度

content = generator("我爱Python", length=1000)
print(content)

输出

要想清楚, 我爱Python, 到底是一种怎么样的存在. 我们都知道, 只要有意义, 那么就必须慎重考虑.了解清楚我爱Python到底是一种怎么样的存在, 是解决一切问题的关键.
从这个角度来看, 一般来说, 带着这些问题, 我们来审视一下我爱Python. 我们不得不面对一个非常尴尬的事实, 那就是, 吉姆·罗恩在不经意间这样说过, 要么你主宰生活,要么你被生活主宰。这句话把我们带到了一个新的维度去思考这个问题: 我爱Python, 到底应该如何实现. 每个人都不得不面对这些问题.  在面对这种问题时, 问题的关键究竟为何? 可是,即使是这样,我爱Python的出现仍然代表了一定的意义. 我们一般认为, 抓住了问题的关键, 其他一切则会迎刃而解.了解清楚我爱Python到底是一种怎么样的存在, 是解决一切问题的关键.我认为, 了解清楚我爱Python到底是一种怎么样的存在, 是解决一切问题的关键.我爱Python, 到底应该如何实现. 我爱Python的发生, 到底需要如何做到, 不我爱Python的发生, 又会如何产生. 现在, 解决我爱Python的问题, 是非常非常重要的. 所以, 我们不妨可以这样来想: 现在, 解决我爱Python的问题, 是非常非常重要的. 所以, 我爱Python, 到底应该如何实现. 马克思说过一句富有哲理的话, 一切节省,归根到底都归结为时间的节省。这启发了我. 我们不妨可以这样来想: 我爱Python似乎是一种巧合,但如果我们从一个更大的角度看待问题,这似乎是一种不可避免的事实. 问题的关键究竟为何? 歌德曾经说过一句富有哲理的话,流水在碰到底处时才会释放活力。带着这句话, 我们还要更加慎重的审视这个问题: 我们不得不面对一个非常尴尬的事实, 那就是, 我们不得不面对一个非常尴尬的事实, 那就是, 我爱Python, 到底应该如何实现. 一般来讲, 我们都必须务必慎重的考虑考虑. 我们都知道, 只要有意义, 那么就必须慎重考虑.总结的来说,
我们一般认为, 抓住了问题的关键, 其他一切则会迎刃而解.
这种事实对本人来说意义重大, 相信对这个世界也是有一定意义的.既然如何, 就我个人来说, 我爱Python对我的意义, 不能不说非常重大. 我爱Python, 发生了会如何, 不发生又会如何. 莎士比亚说过一句著名的话, 意志命运往往背道而驰,决心到最后会全部推倒。这句话语虽然很短, 但令我浮想联翩.

是不是很简单。

当然,你也可以引入更多NLP等技术进来,不过这对我来说

原项目地址:https://github.com/menzi11/BullshitGenerator

重构后的代码地址:

https://github.com/lzjun567/BullshitGenerator

总结

以上所述是小编给大家介绍的so easy!10行代码写个"狗屁不通"文章生成器功能,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

(0)

相关推荐

  • 一篇文章彻底搞懂Python中可迭代(Iterable)、迭代器(Iterator)与生成器(Generator)的概念

    前言 在Python中可迭代(Iterable).迭代器(Iterator)和生成器(Generator)这几个概念是经常用到的,初学时对这几个概念也是经常混淆,现在是时候把这几个概念搞清楚了. 0x00 可迭代(Iterable) 简单的说,一个对象(在Python里面一切都是对象)只要实现了只要实现了__iter__()方法,那么用isinstance()函数检查就是Iterable对象: 例如 class IterObj: def __iter__(self): # 这里简单地返回自身 #

  • 一篇文章弄懂Python中的可迭代对象、迭代器和生成器

    我们都知道,序列可以迭代.但是,你知道为什么吗? 本文来探讨一下迭代背后的原理. 序列可以迭代的原因:iter 函数.解释器需要迭代对象 x 时,会自动调用 iter(x).内置的 iter 函数有以下作用: (1) 检查对象是否实现了 iter 方法,如果实现了就调用它,获取一个迭代器. (2) 如果没有实现 iter 方法,但是实现了 getitem 方法,而且其参数是从零开始的索引,Python 会创建一个迭代器,尝试按顺序(从索引 0 开始)获取元素. (3) 如果前面两步都失败,Pyt

  • so easy!10行代码写个"狗屁不通"文章生成器功能

    前几天,GitHub 有个开源项目特别火,只要输入标题就可以生成一篇长长的文章. 背后实现代码一定很复杂吧,里面一定有很多高深莫测的机器学习等复杂算法 不过,当我看了源代码之后 这程序不到50行 尽管我有多年的Python经验,但我竟然一时也没有看懂 这代码放到编辑器里还特么真能执行 当然啦,原作者也说了,这个代码也是在无聊中诞生的,平时撸码是不写中文变量名的, 中文变量名只是最开始瞎写的时候边写语料边写代码时懒得切英文输入法了. 中文变量名也就忍了,但代码逻辑不好懂,最后我还是忍着剧烈的头痛把

  • 用Python自动清理电脑内重复文件,只要10行代码(自动脚本)

    给定一个文件夹,使用Python检查给定文件夹下有无文件重复,若存在重复则删除 主要涉及的知识点有: os模块综合应用 glob模块综合应用 利用filecmp模块比较两个文件 步骤分析 该程序实现的逻辑可以具化为: 遍历获取给定文件夹下的所有文件,然后通过嵌套循环两两比较文件是否相同,如果相同则删除后者. 实现问题的关键就变成了 如何判断两个文件是否相同? 在这里我们可以使用filecmp模块,来看看官方的介绍文档: filecmp.cmp(f1, f2, shallow=True) 比较名为

  • python实战之90行代码写个猜数字游戏

    一.导入库 import random import time 二.注册用户 我们用变量与input实现 name = str(input('请输入用户名:')) print('欢迎您,'+name) 三.注册年龄 这里我们得用except制作乱输文本就游戏结束的程序 乱输文本就结束 try: age = int(input('请输入年龄:')) except ValueError: print('非法输入') age = 30000 顺便把年龄设为30000[滑稽] 再根据年龄大小分配金币 四

  • python用10行代码实现对黄色图片的检测功能

    本文实例讲述了python用10行代码实现对黄色图片的检测功能.分享给大家供大家参考.具体如下: 原理:将图片转换为YCbCr模式,在图片中寻找图片色值像素,如果在皮肤色值内的像素面积超过整个画面的1/3,就认为是黄色图片. 申明:简单场景还是够用了,稍微复杂一点就不准确了,例如:整幅画面是人的头像,皮肤色值的像素必然超过50%,被误认为黄色图片就太武断了. 需要安装python图片库PIL支持 porn_detect.py如下: import sys,PIL.Image as Image im

  • 80行代码写一个Webpack插件并发布到npm

    1. 前言 最近在学习 Webpack 相关的原理,以前只知道 Webpack 的配置方法,但并不知道其内部流程,经过一轮的学习,感觉获益良多,为了巩固学习的内容,我决定尝试自己动手写一个插件. 这个插件实现的功能比较简单: 默认清除 js 代码中的 console.log 的打印输出: 可通过传入配置,实现移除 console 的其它方法,如 console.warn.console.error 等: 2. Webpack 的构建流程以及 plugin 的原理 2.1 Webpack 构建流程

  • 100行代码实现一个vue分页组功能

    今天用vue来实现一个分页组件,总体来说,vue实现比较简单,样式部分模仿了elementUI.所有代码的源码可以再github上下载的到:下载地址 先来看一下实现效果: 点击查看效果 整体思路 我们先看一下使用到的文件的目录: 我们在 pageComponentsTest.vue 页面引入了 pageComponent.vue 分页组件.整体思路是通过 props 来达到组件的灵活通用的效果,整体语法是使用vue的VM语法. pageComponent.vue实现 首先实现一个分页,需要知道数

  • jQuery仅用3行代码实现的显示与隐藏功能完整实例

    本文实例讲述了jQuery仅用3行代码实现的显示与隐藏功能.分享给大家供大家参考.具体如下: jQuery技术相当好使用,的确可以用很少的代码实现想要的功能,比如这款经常用到的"显示"与"隐藏"的功能,只需要3行代码就实现了,确实够给力. 运行效果截图如下: 在线演示地址如下: http://demo.jb51.net/js/2015/jquery-simple-hide-show-style-demo/ 具体代码如下: <!doctype html>

  • CMSPRESS 10行代码搞定 PHP无限级分类2

    超级无限分类 使用简单 效率极高 核心代码10行不到 另外 求这个分类的不足,和更高效简单的无限分类方法 ^_^ 核心代码如下 class Tool { static public $treeList = array(); //存放无限分类结果如果一页面有多个无限分类可以使用 Tool::$treeList = array(); 清空 /** * 无限级分类 * @access public * @param Array $data //数据库里获取的结果集 * @param Int $pid

  • 100行代码实现vue表单校验功能(小白自编)

    两个文件,一个写逻辑,一个写校验规则: 特点:逻辑简单,代码量少,够用: 不想看代码直接新建这两个文件复制代码,看最下面的使用方法: 示例图片 //validator.js //引入校验规则 var valitatorRules = require('./valitator-rules.js'); export const Validator=function(formName,rules,errors){ // rules:{ // name:'required|regexp_hanzi',

  • Python的爬虫框架scrapy用21行代码写一个爬虫

    开发说明 开发环境:Pycharm 2017.1(目前最新) 开发框架:Scrapy 1.3.3(目前最新) 目标 爬取线报网站,并把内容保存到items.json里 页面分析 根据上图我们可以发现内容都在类为post这个div里 下面放出post的代码 <div class="post"> <!-- baidu_tc block_begin: {"action": "DELETE"} --> <div class=

随机推荐