python读取图像数据集(python读取图片像素值)
Python如何图像识别?
1. 简介。
图像处理是一门应用非常广的技术,而拥有非常丰富第三方扩展库的 Python 当然不会错过这一门盛宴。PIL (Python Imaging Library)是 Python 中最常用的图像处理库,目前版本为 1.1.7,我们可以?在这里?下载学习和查找资料。
Image 类是 PIL 库中一个非常重要的类,通过这个类来创建实例可以有直接载入图像文件,读取处理过的图像和通过抓取的方法得到的图像这三种方法。
2. 使用。
导入 Image 模块。然后通过 Image 类中的 open 方法即可载入一个图像文件。如果载入文件失败,则会引起一个 IOError ;若无返回错误,则 open 函数返回一个 Image 对象。现在,我们可以通过一些对象属性来检查文件内容,即:
1 import Image
2 ? im = Image.open("j.jpg")
3 ? print im.format, im.size, im.mode
4 JPEG (440, 330) RGB
这里有三个属性,我们逐一了解。
format : 识别图像的源格式,如果该文件不是从文件中读取的,则被置为 None 值。
size : 返回的一个元组,有两个元素,其值为象素意义上的宽和高。
mode : RGB(true color image),此外还有,L(luminance),CMTK(pre-press image)。
现在,我们可以使用一些在 Image 类中定义的方法来操作已读取的图像实例。比如,显示最新载入的图像:
1 im.show()
2 ?
输出原图:
3. 函数概貌。
3.1 ? ?Reading and Writing Images : open( infilename ) , save( outfilename )
3.2 ? ?Cutting and Pasting and Merging Images :
crop() : 从图像中提取出某个矩形大小的图像。它接收一个四元素的元组作为参数,各元素为(left, upper, right, lower),坐标系统的原点(0, 0)是左上角。
paste() :
merge() :
1 box = (100, 100, 200, 200)
2 ? region = im.crop(box)
3 ? region.show()
4 ? region = region.transpose(Image.ROTATE_180)
5 ? region.show()
6 ? im.paste(region, box)
7 ? im.show()
其效果图为:
旋转一幅图片:
1 def roll(image, delta):
2 ?? ?"Roll an image sideways"
3
4 ?? ?xsize, ysize = image.size
5
6 ?? ?delta = delta % xsize
7 ?? ?if delta == 0: return image
8
9 ?? ?part1 = image.crop((0, 0, delta, ysize))
10 ?? ?part2 = image.crop((delta, 0, xsize, ysize))
11 ?? ?image.paste(part2, (0, 0, xsize-delta, ysize))
12 ?? ?image.paste(part1, (xsize-delta, 0, xsize, ysize))
13
14 ?? ?return image
3.3 ? ?几何变换。
3.3.1 ? ?简单的几何变换。
1 out = im.resize((128, 128)) ? ? ? ? ? ? ? ? ? ? #
2 ?out = im.rotate(45) ? ? ? ? ? ? ? ? ? ? ? ? ? ??#逆时针旋转 45 度角。
3 ?out = im.transpose(Image.FLIP_LEFT_RIGHT) ? ? ? #左右对换。
4 ?out = im.transpose(Image.FLIP_TOP_BOTTOM) ? ? ? #上下对换。
5 ?out = im.transpose(Image.ROTATE_90) ? ? ? ? ? ? #旋转 90 度角。
6 ?out = im.transpose(Image.ROTATE_180) ? ? ? ? ? ?#旋转 180 度角。
7 out = im.transpose(Image.ROTATE_270) ? ? ? ? ? ?#旋转 270 度角。
各个调整之后的图像为:
图片1:
图片2:
图片3:
图片4:
3.3.2 ? ?色彩空间变换。
convert() : 该函数可以用来将图像转换为不同色彩模式。
3.3.3 ? ?图像增强。
Filters : 在 ImageFilter 模块中可以使用 filter 函数来使用模块中一系列预定义的增强滤镜。
1 import ImageFilter
2 imfilter = im.filter(ImageFilter.DETAIL)
3 imfilter.show()
3.4 ? ?序列图像。
即我们常见到的动态图,最常见的后缀为 .gif ,另外还有 FLI / FLC 。PIL 库对这种动画格式图也提供了一些基本的支持。当我们打开这类图像文件时,PIL 自动载入图像的第一帧。我们可以使用 seek 和 tell 方法在各帧之间移动。
1 import Image
2 im.seek(1) ? ? ? ?# skip to the second frame
3
4 try:
5 ?? ?while 1:
6 ?? ? ? ?im.seek( im.tell() + 1)
7 ?? ? ? ?# do something to im
8 except EOFError:
9 ?? ?pass
3.5 ? ?更多关于图像文件的读取。
最基本的方式:im = Image.open("filename")
类文件读取:fp = open("filename", "rb"); im = Image.open(fp)
字符串数据读取:import StringIO; im = Image.open(StringIO.StringIO(buffer))
从归档文件读取:import TarIO; fp = TarIo.TarIO("Image.tar", "Image/test/lena.ppm"); im = Image.open(fp)
基本的 PIL 目前就练习到这里。其他函数的功能可点击?这里?进一步阅读。
如何用python imageio制作图像数据集
声明在此使用的彩色图转灰度图进行的单通道的图像存储,对于多通道的图像随后进行总结
主要流程是将图像数据读出
将图像转换成numpy的数组形式
将图像进行行的处理编程行向量的存储
之后是将数据与标签进行合并存储
存储在一个list中
将这个数据集进行数据的打乱顺序,(随机化的过程)
主要的过程就是这些了
下面是代码的
===========================
# -*-coding:utf-8-*-
import numpy
import theano
from PIL import Image
from pylab import *
import os
import theano.tensor as T
import random
import pickle
def dataresize(path=r'D:\worksapce_python\20160426_cp\testing'):
# test path
path_t =r"D:\worksapce_python\20160426_cp\training"
# train path
datas = []
train_x= []
train_y= []
valid_x= []
valid_y= []
test_x= []
test_y= []
for dirs in os.listdir(path):
# print dirs
for filename in os.listdir(os.path.join(path,dirs)):
imgpath =os.path.join(os.path.join(path,dirs),filename)
img = Image.open(imgpath)
img =img.convert('L').resize((28,28))
width,hight=img.size
img = numpy.asarray(img,dtype='float64')/256.
python 图片读取 常用操作方法
批量获取图片:
keras 多张图片:
很多情况下,你并不能使用以上这些方法来直接输入数据去训练或者预测,原因是你的数据集太大了,没办法把所有的图片都载入到内存当中。那keras的data generator就派上用场了,当你的模型需要训练数据的时候,generator会自动从cpu生成一批图片,喂到GPU里面让模型进行训练,依次循环,直到训练结束。
压缩数据中维度为1的维度, numpy.squeeze()
模型是不能直接对图片进行卷积操作的,必须先转化为numpy数组才能输入模型里面去,而且如果数据集的图片尺寸不统一,也有不同的操作细节。
keras 模型保存路径: C:\Users\你的用户名.keras\models
notop代表是否包括顶层的全连接层,默认include_top=True,包括全连接层。
tf -- tensorflow 或者 CNTK
th -- theano