浅析Go语言版本的forgery

使用过Python语言的朋友们可能使用过 forgery_py ,它是一个伪造数据的工具。能伪造一些常用的数据。在我们开发过程和效果展示是十分有用。但是没有Go语言版本的,所以就动手折腾吧。

从源码入手

在forgery_py的 PyPi 有一段的实例代码:

>>> import forgery_py
>>> forgery_py.address.street_address()
u'4358 Shopko Junction'
>>> forgery_py.basic.hex_color()
'3F0A59'
>>> forgery_py.currency.description()
u'Slovenia Tolars'
>>> forgery_py.date.date()
datetime.date(2012, 7, 27)
>>> forgery_py.internet.email_address()
u'brian@zazio.mil'
>>> forgery_py.lorem_ipsum.title()
u'Pretium nam rhoncus ultrices!'
>>> forgery_py.name.full_name()
u'Mary Peters'
>>> forgery_py.personal.language()
u'Hungarian'

从以上的方法调用我们可以看出forgery_py下有一系列的 *.py 文件,里面有各种方法,实现各种功能,我们在来通过分析下Python版本的forgery_py的源码来看看它的实现原理。

# ForgeryPy 包的一级目录
├── dictionaries # 伪造内容和来源目录,目录下存放的都是一些文本文件
├── dictionaries_loader.py # 加载文件脚本
├── forgery    # 主目录,实现各种数据伪造功能,目录下存放的都是python文件
├── __init__.py

我们在来看下forgery目录下的脚本

$ cat name.py
import random
from ..dictionaries_loader import get_dictionary
__all__ = [
  'first_name', 'last_name', 'full_name', 'male_first_name',
  'female_first_name', 'company_name', 'job_title', 'job_title_suffix',
  'title', 'suffix', 'location', 'industry'
]
def first_name():
  """Random male of female first name."""
  _dict = get_dictionary('male_first_names')
  _dict += get_dictionary('female_first_names')
  return random.choice(_dict).strip()

__all__ 设置能被调用的方法。

first_name() 方法是forgery_py中一个典型伪造数据方法,我们只要来分析它就可以知道forgery_py的工作原理了。

这个方法代码很少,能容易就看出 _dict = get_dictionary('male_first_names') _dict += get_dictionary('female_first_names') 获取的数据合并,在最后的 return random.choice(_dict).strip() 返回随机的数据。它的重点在于 get_dictionary() ,所以我们需要来看它的所在位置 dictionaries_loader.py 文件。

$ cat dictionaries_loader
import random
DICTIONARIES_PATH = abspath(join(dirname(__file__), 'dictionaries'))
dictionaries_cache = {}
def get_dictionary(dict_name):
  """
  Load a dictionary file ``dict_name`` (if it's not cached) and return its
  contents as an array of strings.
  """
  global dictionaries_cache
  if dict_name not in dictionaries_cache:
    try:
      dictionary_file = codecs.open(
        join(DICTIONARIES_PATH, dict_name), 'r', 'utf-8'
      )
    except IOError:
      None
    else:
      dictionaries_cache[dict_name] = dictionary_file.readlines()
      dictionary_file.close()
  return dictionaries_cache[dict_name]

以上就是 dictionaries_loader.py 文件去掉注释后的所以要内容。它的主要实现就是:定义一个全局的字典参数 dictionaries_cache 作为缓存,然后定义方法 get_dictionary() 获取源数据, get_dictionary() 中每次forgery目录底下方法调用时先查看缓存,缓存字典中存在数据就直接输出,不存在就读取 dictionaries 底下的对应文件,并存入缓存。最后是返回数据。

总的来说forgery_py的原理就是:一个方法调用,去读内存中的缓存,存在就直接返回,不存在就到对应的文本文件中读取并写入缓存并返回。返回来的数据再随机选取输出结果。

使用Go语言实现

在了解了forgery_py的工作原理之后,我们就可以来使用Go语言来实现了。

# forgery的基本目录
$ cat forgery
├── dictionaries # 数据源
│  ├── male_first_names
├── name.go  # 具体功能实现
└── loader.go # 加载数据

根据python版本的我们也来创建对应的目录。

实现数据的读取的缓存:

// forgery/loader.go
package forgery
import (
  "os"
  "io"
  "bufio"
  "math/rand"
  "time"
  "strings"
)
// 全局的缓存map
var dictionaries map[string][]string = make(map[string][]string)
// 在获取数据之后随机输出
func random(slice []string) string {
  rand.Seed(time.Now().UnixNano())
  n := rand.Intn(len(slice))
  return strings.TrimSpace(slice[n])
}
// 主要的数据加载方法
func loader(name string) (slice []string, err error) {
  slice, ok := dictionaries[name]
  // 缓存中存在数据,直接返回
  if ok {
    return slice, nil
  }
  // 读取对应文件
  file, err := os.Open("./dictionaries/" + name)
  if err != nil {
    return slice, err
  }
  defer file.Close()
  rd := bufio.NewReader(file)
  for {
    line, err := rd.ReadString('\n')
    slice = append(slice, line)
    if err != nil || io.EOF == err {
      break
    }
  }
  dictionaries[name] = slice
  return slice, nil
}
// 统一的错误处理
func checkErr(err error) (string, error) {
  return "", err
}

实现具体的功能:

// forgery/name.go
// Random male of female first name.
func FirstName() (string, error) {
  slice, err := loader("male_first_names")
  checkErr(err)
  slice1, err := loader("female_first_names")
  checkErr(err)
  slice = append(slice, slice1...)
  return random(slice), nil
}

这样就将python语言版本的forgery_py使用Go来实现了。

最后

上面只是提及了一些工作原理,具体的源代码可以看 https://github.com/xingyys/fo... ,也十分感谢 https://github.com/tomekwojci... ,具体的思路和里面的数据源都是他提供的。本人就是做了一些 翻译 的的工作。

总结

以上所述是小编给大家介绍的Go语言版本的forgery,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!

(0)

相关推荐

  • 浅析Go语言版本的forgery

    使用过Python语言的朋友们可能使用过 forgery_py ,它是一个伪造数据的工具.能伪造一些常用的数据.在我们开发过程和效果展示是十分有用.但是没有Go语言版本的,所以就动手折腾吧. 从源码入手 在forgery_py的 PyPi 有一段的实例代码: >>> import forgery_py >>> forgery_py.address.street_address() u'4358 Shopko Junction' >>> forgery_

  • 浅析Python语言自带的数据结构有哪些

    Python作为一种脚本语言,其要求强制缩进,使其易读.美观,它的数据类型可以实现自动转换,而不需要像C.Java那样给变量定义数据类型,使其编写非常方便简单,所以广受大家的欢迎. 现如今,Python已经广泛的应用于数据分析.数据挖掘.机器学习等众多科学计算领域.所以既然涉及到科学计算,深入了解Python原生提供的数据结构是很有必要的,这样才能在数据的海洋中游刃有余.得心应手.本文便以此展开,做一个归纳整理,方便收藏. Python 一.序列结构 首先介绍的数据结构是序列结构,所谓序列,也就

  • 将易程序转换为另一个语言版本的方法

    易语言目前有简体中文,繁体中文,日文三个不同的语言版本,当系统打开另外一个语言版本的易程序时,会自动进行语言转换,无需用户手工操作. 虽然源程序的转换不需要用户手工操作,但是一些程序所依赖的外部文件还是需要,具体列出如下: 1.在某个语言版本下建立的易语言数据库,欲拿到另外一个语言版本中使用前必须先用系统中提供的"数据库语言转换"工具进行转换. 2.在某个语言版本下使用"易之表"建立的GRD表格文件,欲拿到另外一个语言版本中使用前需要使用"易之表"

  • 深入浅析C语言与C++的区别与联系

    目录 一.C语言是面向过程语言,而C++是面向对象语言 1.面向过程和面向对象的区别 2.面向过程和面向对象的优缺点 面向过程语言 面向对象语言 二.具体语言上的区别 1.关键字的不同 2.后缀名不同 3.返回值 4.参数列表 5.缺省参数 半缺省参数 全缺省参数 6.函数重载 7.const 总结 8.引用 9.malloc,free && new,delete 10.作用域 C语言虽说经常和C++在一起被大家提起,但可千万不要以为它们是一种编程语言.我们来介绍C语言和C++中的区别和联

  • Java简单实现猜数字游戏附C语言版本

    目录 前言 一.C语言版本 代码 运行结果 二.Java版本 代码 运行结果 总结 前言 以前在学C语言的时候,做过一个猜数字游戏,这两天学了Java的逻辑结构,试着用Java实现下. 一.C语言版本 以前做的C语言版本. 代码 #define _CRT_SECURE_NO_WARNINGS #include <stdio.h> #include <stdlib.h> #include <time.h> void menu() { printf("******

  • 浅析Go语言容器之数组和切片的使用

    目录 序列容器 数组 Vector Deque List 单链表 总结 在 Java 的核心库中,集合框架可谓鼎鼎大名:Array .List.Set.Queue.HashMap 等等,随便拎一个出来都值得开发者好好学习如何使用甚至是背后的设计源码(这类文章也挺多,大家上网随便一搜). 虽然 Go 语言没有如此丰富的容器类型,但也有一些基本的容器供开发者使用,接下来让我们一一认识这些容器类型吧. 序列容器 序列容器存储特定类型的数据元素.目前有 5 种序列容器的实现: array vector

  • 浅析Go语言的数据类型及数组

    目录 Go语言身世简介 Go语言的第一个程序 Go语言的数据类型 Go语言匿名变量 Go语言的数据类型 Go语言中的数组 Go语言身世简介 Go(又称 Golang)是 Google 的 Robert Griesemer,Rob Pike 及 Ken Thompson 开发的一种静态强类型.编译型语言.Go 语言语法与 C 相近,但功能上有:内存安全,GC(垃圾回收),结构形态及 CSP-style 并发计算. Go语言的第一个程序 我们使用的IDE工具为GoLand(没错,又是Jetbrain

  • 浅析Go语言中闭包的使用

    目录 闭包基本介绍 闭包实现数字累加 代码说明 代码分析 闭包案例 上代码 代码说明 闭包基本介绍 闭包就是 一个函数 和其相关的 引用环境 组合的一个整体 好处: 保存引用的变量,下次继续使用,不会销毁 下面通过闭包的方式,写一个数字累加器,体验一下闭包的妙处 闭包实现数字累加 package main import "fmt" // 累加器 // 闭包 - 函数柯里化 // 返回值类型: func(int) int func AddUpper() func(int) int { v

  • 浅析Go语言中数组的这些细节

    目录 Go语言基础二 len&cap 二维数组的遍历 数组的拷贝与传参 求数组所有元素之和 例题:数组元素匹配问题 今日总结 Go语言基础二 len&cap 书接上文,我们提到二维数组中的第二个维度的数组不能用...来表示,接下来我们要认识两个新的函数,它们分别是len和cap package main ​ func main() { a := [2]int{} println(len(a), cap(a)) } 由上方代码可知,我们在main函数里面定义了一个a数组,长度为2,未进行初始

  • 浅析C语言中的数组及字符数组

    我们来编写一个程序,以统计各个数字.空白符(包括空格符.制表符及换行符)以及所有其它字符出现的次数.这个程序的实用意义并不大,但我们可以通过该程序讨论 C 语言多方面的问题. 所有的输入字符可以分成 12 类,因此可以用一个数组存放各个数字出现的次数,这样比使用 10 个独立的变量更方便.下面是该程序的一种版本: #include <stdio.h> /* count digits, white space, others */ main() { int c, i, nwhite, nothe

随机推荐