Pytorch入门与实践——AI插画师：生成对抗网络数据集制作-伙伴云

Pytorch入门与实践——AI插画师：生成对抗网络数据集制作

网友投稿 707 2022-05-30

摘要

1、用爬虫爬取二次元妹子的图片

2、获取图片中的头像

摘要

最近想搞一搞GAN，但是发现《pytorch入门与实践——AI插画师：生成对抗网络》，但是发现数据集的链接失效了，所以自己制作一份。

代码来自何之源 - 知乎，我做了一些修改。

1、用爬虫爬取二次元妹子的图片

数据从konachan.net - Konachan.com Anime Wallpapers网站中下载的，是一个非常著名的动漫网站（不过我不知道）代码如下：

import requests from bs4 import BeautifulSoup import os import traceback def download(url, filename): if os.path.exists(filename): print('file exists!') return try: r = requests.get(url, stream=True, timeout=60) r.raise_for_status() with open(filename, 'wb') as f: for chunk in r.iter_content(chunk_size=1024): if chunk: # filter out keep-alive new chunks f.write(chunk) f.flush() return filename except KeyboardInterrupt: if os.path.exists(filename): os.remove(filename) raise KeyboardInterrupt except Exception: traceback.print_exc() if os.path.exists(filename): os.remove(filename) if os.path.exists('imgs') is False: os.makedirs('imgs') start =1 end = 8000 for i in range(start, end + 1): url = 'https://konachan.net/post?page=%d&tags=' % i html = requests.get(url).text soup = BeautifulSoup(html, 'html.parser') for img in soup.find_all('img', class_="preview"): target_url =img['src'] filename = os.path.join('imgs', target_url.split('/')[-1]) download(target_url, filename) print('%d / %d' % (i, end))

运行代码后就能在imgs文件夹看到二次元妹子的照片，各种各样的，目不暇接、眼花缭乱。。。。。

2、获取图片中的头像

截取头像和原文一样，直接使用github上一个基于opencv的工具，地址：https://github.com/nagadomi/lbpcascade_animeface，将lbpcascade_animeface.xml（准确率挺高的，不过有点猥琐，大家试一下就知道了。。。。。。）文件，放到根目录下。

然后运行下面的代码：

import cv2 import sys import os.path from glob import glob def detect(filename, cascade_file="lbpcascade_animeface.xml"): if not os.path.isfile(cascade_file): raise RuntimeError("%s: not found" % cascade_file) cascade = cv2.CascadeClassifier(cascade_file) image = cv2.imread(filename) gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) gray = cv2.equalizeHist(gray) faces = cascade.detectMultiScale(gray, # detector options scaleFactor=1.1, minNeighbors=5, minSize=(48, 48)) for i, (x, y, w, h) in enumerate(faces): face = image[y: y + h, x:x + w, :] face = cv2.resize(face, (96, 96)) save_filename = '%s-%d.jpg' % (os.path.basename(filename).split('.')[0], i) cv2.imwrite("faces/" + save_filename, face) if __name__ == '__main__': if os.path.exists('faces') is False: os.makedirs('faces') file_list = glob('imgs/*.jpg') for filename in file_list: detect(filename)

Pytorch入门与实践——AI插画师：生成对抗网络数据集制作

随便放几张截取后的头像：

连接是我制作的数据：AI插画师：生成对抗网络数据集.zip-深度学习文档类资源-CSDN下载

运行上面的代码就可以截取二次元妹子的头像了，到这里数据集制作完成了，然后我们一起GAN。如果你觉得有帮助请、，也可以打赏，多少随意。

网站

Excel函数如何入门给20个学生的成绩做一个等级的评定你会吗（excel各种函数的使用步骤）

707 2022-05-30

Pytorch入门与实践——AI插画师：生成对抗网络数据集制作

《Office 2013快速入门指南》简体中文版下载（暂未上线）（office是什么意思）

Office 2016 快速入门指南下载（暂未上线）（office办公软件）

Excel函数如何入门给20个学生的成绩做一个等级的评定你会吗（excel各种函数的使用步骤）

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

什么是在线文档？怎么发在线文档

定制订单管理系统（为特定需求定制的订单管理系统）

友情链接

Pytorch入门与实践——AI插画师：生成对抗网络数据集制作

微信扫一扫：分享

推荐文章

最近发表

热评文章

友情链接