admin管理员组

文章数量:1130349

用 Python 在 Excel 中画出蒙娜丽莎

文 | 麦麦麦造 出处 | 掘金

之前看到过很多头条,说哪国某人坚持了多少年自学使用 excel 画画,效果十分惊艳。对于他们的耐心我十分敬佩。但是作为一个程序员,自然也得挑战一下自己。这种需求,我们十分钟就可以完成!

基本思路

实现这个需求的基本思路是读取这张图片每一个像素的色彩值,然后给 excel 里的每一个单元格填充上颜色。所以主要用到的是 PILopenpyxl这两个库。

PIL 使用

PIL是 Python 里面做图像处理的时候十分常用的一个库,功能也是十分的强大,这里只需要用到 PIL里一小部分的功能。

  1. from PIL import Image

  2. img = Image.open(img_path) # 读取图片

  3. width, height = img.size # 获取图片大小

  4. r, g, b = img.getpixel((w - 1, h - 1)) # 获取像素色彩值

  5. 复制代码

Image.open()是 PIL 里面打开一张图片的函数,支持多种图片类型

img_path是图片路径,可以是相对路径,也可以是绝对路径

img.size是获取图片的 size属性,包含图片的宽和高

img.getpixel()是获取图片色彩值的函数,需传入一个 tuplelist,值为像素坐标 xy

openpyxl 使用

openpyxl几乎是 Python 里功能最全的操作 excel 文件的库了,这里也只需要用到它的一小部分功能。

  1. import openpyxl

  2. from openpyxl.styles import fills

  3. workbook = openpyxl.Workbook()

  4. worksheet = workbook.active

  5. cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)

  6. workbook.save(out_file)

openpyxl.Workbook()新建一个 excel 文件

workbook.active 激活一个工作表

cell.fill=fills.PatternFill(fill_type="solid",fgColor=hex_rgb)填充一个单元格, fill_type="solid"是填充类型, fgColor=hex_rgb是填充的颜色

workbook.save()保存文件,需传入要保存的文件名

写一段代码

写这一个画图的需求需要用到的核心就是上面介绍的 PILopenpyxl的几种用法。但是在实际写的时候,还会有一些其他问题,比如:

1、getpixel() 获取的颜色值是rgb十进制的,但fills.PatternFill 里的fgColor`参数接收到的颜色值是十六进制的值。

这个问题其实就是十进制转十六进制,很容易解决

  1. def int_to_16(num):

  2. num1 = hex(num).replace('0x', '')

  3. num2 = num1 if len(num1) > 1 else '0' + num1 # 位数只有一位的时候在前面补零

  4. return num2

2、excel 的单元格默认是长方形,修改为正方形才不会使图片变形

  1. if h == 1:

  2. _w = cell.column

  3. _h = cell.col_idx

  4. # 调整列宽

  5. worksheet.column_dimensions[_w].width = 1

  6. # 调整行高

  7. worksheet.row_dimensions[h].height = 6

这里用到了双重 for 循环,外层是 width,里层是 height,是一列一列的填充颜色,因此判断 ifh==1,避免多次调整列宽。

3、excel 支持的样式数量有限

这个问题比较严重。如果直接对高清大图进行操作,最后输出的 excel 文件在打开的时候,可能会提示我们文件有问题,需要自动修复。

但是等它修复完成之后,会发现填充的所有颜色都消失了!

一开始以为是使用的行列数过多了原因。

查询资料后发现,13 版 excel 支持的大行数是 1048576,最大列数是 16384,我们使用的单元格数量还远没达到限制。

在经过更换图片、更换 excel 版本,修改代码等不充分各种测试,才找到问题的原因所在。

原来是因为,excel 的原形是由多个 xml 文件,填充的颜色都存储在一个 style.xml文件里面,当这个文件过大就会导致打开的时候报错。

所以为了解决这个问题,有两个解决方案,第一是缩小图片,第二是减少图片颜色。缩小图片的时候自带减少图片颜色的功能,减少图片颜色的方法可以采用灰度化、二值化等方法。

总体上来讲,就是需要控制 颜色数量*单元格数<阈值(3300w左右)

  1. MAX_WIDTH = 300

  2. MAX_HEIGHT = 300

  3. def resize(img):

  4. w, h = img.size

  5. if w > MAX_WIDTH:

  6. h = MAX_WIDTH / w * h

  7. w = MAX_WIDTH

  8. if h > MAX_HEIGHT:

  9. w = MAX_HEIGHT / h * w

  10. h = MAX_HEIGHT

  11. return img.resize((int(w), int(h)), Image.ANTIALIAS)

  12. 复制代码

最终效果

苍天不负有心人,打开最后输出的 excel 已经可以看到效果了!

所以说,一切能用 Python 解决的问题,最终都会用 Python 来解决。

全部代码

  1. # draw_excel.py

  2. from PIL import Image

  3. import openpyxl

  4. from openpyxl.styles import fills

  5. import os

  6. MAX_WIDTH = 300

  7. MAX_HEIGHT = 300

  8. def resize(img):

  9. w, h = img.size

  10. if w > MAX_WIDTH:

  11. h = MAX_WIDTH / w * h

  12. w = MAX_WIDTH

  13. if h > MAX_HEIGHT:

  14. w = MAX_HEIGHT / h * w

  15. h = MAX_HEIGHT

  16. return img.resize((int(w), int(h)), Image.ANTIALIAS)

  17. def int_to_16(num):

  18. num1 = hex(num).replace('0x', '')

  19. num2 = num1 if len(num1) > 1 else '0' + num1

  20. return num2

  21. def draw_jpg(img_path):

  22. img_pic = resize(Image.open(img_path))

  23. img_name = os.path.basename(img_path)

  24. out_file = './result/' + img_name.split('.')[0] + '.xlsx'

  25. if os.path.exists(out_file):

  26. os.remove(out_file)

  27. workbook = openpyxl.Workbook()

  28. worksheet = workbook.active

  29. width, height = img_pic.size

  30. for w in range(1, width + 1):

  31. for h in range(1, height + 1):

  32. if img_pic.mode == 'RGB':

  33. r, g, b = img_pic.getpixel((w - 1, h - 1))

  34. elif img_pic.mode == 'RGBA':

  35. r, g, b, a = img_pic.getpixel((w - 1, h - 1))

  36. hex_rgb = int_to_16(r) + int_to_16(g) + int_to_16(b)

  37. cell = worksheet.cell(column=w, row=h)

  38. if h == 1:

  39. _w = cell.column

  40. _h = cell.col_idx

  41. # 调整列宽

  42. worksheet.column_dimensions[_w].width = 1

  43. # 调整行高

  44. worksheet.row_dimensions[h].height = 6

  45. cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)

  46. print('write in:', w, ' | all:', width + 1)

  47. print('saving...')

  48. workbook.save(out_file)

  49. print('success!')

  50. if __name__ == '__main__':

  51. draw_jpg('mona-lisa.jpg')

附:

上面说到 颜色数量*单元格数<阈值(256^4左右)的时候,可能有人会有疑惑,这个 256^4是怎么来的。

这个当然是我测试信口开河得来的。

既然是有 颜色数量单元格数这两个变量,那么自然要有两个测试方法以上。一个观察 颜色数量,一个观察 单元格数

但我在这里只做了 颜色数量的一个测试。(最大的原因就是生成上万行*上万列的 excel 实在是太久了...懒...)

  1. count = 0

  2. MAX_WIDTH = 255

  3. for w in range(1, MAX_WIDTH + 1):

  4. for h in range(1, MAX_WIDTH + 1):

  5. cell = worksheet.cell(column=w, row=h)

  6. if h == 1:

  7. _w = cell.column

  8. _h = cell.col_idx

  9. # 调整列宽

  10. worksheet.column_dimensions[_w].width = 1

  11. # 调整行高

  12. worksheet.row_dimensions[h].height = 6

  13. if count < 255 ** 3:

  14. back = int_to_16(num=count)

  15. back = '0' * (6 - len(back)) + back

  16. else:

  17. back = ''.join([int_to_16(random.randint(0, 255)) for _ in range(3)])

  18. cell.fill = fills.PatternFill(fill_type="solid", fgColor=back)

  19. count += 1

count是记录颜色的变量,确保每一个颜色都不重复,但目前计算机 RGB 表示的颜色最多只有 256^3 种

通过调整 MAX_WIDTH的值来测试 excel 的阈值

最后生成的测试 excel 如下:

...还有点好看。!??


最后

由于精力有限 懒,能力也有限 菜,所以没有测试单一颜色的,也可能有其他的方法能没有这个阈值的限制。

代码已经全部上传至github,欢迎大家友好交流讨论 [握手]

后台回复【蒙娜丽莎】即可获取代码链接。本文原文链接:

签到送书计划

自律改变自我!第①期打卡送书活动启动!

我发起了一个签到送书活动,活动结束后将送出 5 本 Python 技术书。签到次数越多,中奖概率越高。活动详情,请点击:自律改变自我!第①期打卡送书活动启动!

下面是今天的签到二维码:

回复下方「关键词」,获取优质资源

回复关键词「 pybook03」,立即获取主页君与小伙伴一起翻译的《Think Python 2e》电子版

回复关键词「入门资料」,立即获取主页君整理的 10 本 Python 入门书的电子版

回复关键词「m」,立即获取Python精选优质文章合集

回复关键词「book 数字」,将数字替换成 0 及以上数字,有惊喜好礼哦~

推荐阅读

  • 2019年,大家都是怎么用 Pandas 的?

  • 一篇文章读懂 Python 多线程

  • 效率翻倍!再也不用手动改测试接口的参数了

  • 一行代码弄懂数据,pandas最佳搭档就是ta了

  • 让你赚钱更省力的 10 个开源项目!

题图:pexels,CC0 授权。

好文和朋友一起看~

用 Python 在 Excel 中画出蒙娜丽莎

文 | 麦麦麦造 出处 | 掘金

之前看到过很多头条,说哪国某人坚持了多少年自学使用 excel 画画,效果十分惊艳。对于他们的耐心我十分敬佩。但是作为一个程序员,自然也得挑战一下自己。这种需求,我们十分钟就可以完成!

基本思路

实现这个需求的基本思路是读取这张图片每一个像素的色彩值,然后给 excel 里的每一个单元格填充上颜色。所以主要用到的是 PILopenpyxl这两个库。

PIL 使用

PIL是 Python 里面做图像处理的时候十分常用的一个库,功能也是十分的强大,这里只需要用到 PIL里一小部分的功能。

  1. from PIL import Image

  2. img = Image.open(img_path) # 读取图片

  3. width, height = img.size # 获取图片大小

  4. r, g, b = img.getpixel((w - 1, h - 1)) # 获取像素色彩值

  5. 复制代码

Image.open()是 PIL 里面打开一张图片的函数,支持多种图片类型

img_path是图片路径,可以是相对路径,也可以是绝对路径

img.size是获取图片的 size属性,包含图片的宽和高

img.getpixel()是获取图片色彩值的函数,需传入一个 tuplelist,值为像素坐标 xy

openpyxl 使用

openpyxl几乎是 Python 里功能最全的操作 excel 文件的库了,这里也只需要用到它的一小部分功能。

  1. import openpyxl

  2. from openpyxl.styles import fills

  3. workbook = openpyxl.Workbook()

  4. worksheet = workbook.active

  5. cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)

  6. workbook.save(out_file)

openpyxl.Workbook()新建一个 excel 文件

workbook.active 激活一个工作表

cell.fill=fills.PatternFill(fill_type="solid",fgColor=hex_rgb)填充一个单元格, fill_type="solid"是填充类型, fgColor=hex_rgb是填充的颜色

workbook.save()保存文件,需传入要保存的文件名

写一段代码

写这一个画图的需求需要用到的核心就是上面介绍的 PILopenpyxl的几种用法。但是在实际写的时候,还会有一些其他问题,比如:

1、getpixel() 获取的颜色值是rgb十进制的,但fills.PatternFill 里的fgColor`参数接收到的颜色值是十六进制的值。

这个问题其实就是十进制转十六进制,很容易解决

  1. def int_to_16(num):

  2. num1 = hex(num).replace('0x', '')

  3. num2 = num1 if len(num1) > 1 else '0' + num1 # 位数只有一位的时候在前面补零

  4. return num2

2、excel 的单元格默认是长方形,修改为正方形才不会使图片变形

  1. if h == 1:

  2. _w = cell.column

  3. _h = cell.col_idx

  4. # 调整列宽

  5. worksheet.column_dimensions[_w].width = 1

  6. # 调整行高

  7. worksheet.row_dimensions[h].height = 6

这里用到了双重 for 循环,外层是 width,里层是 height,是一列一列的填充颜色,因此判断 ifh==1,避免多次调整列宽。

3、excel 支持的样式数量有限

这个问题比较严重。如果直接对高清大图进行操作,最后输出的 excel 文件在打开的时候,可能会提示我们文件有问题,需要自动修复。

但是等它修复完成之后,会发现填充的所有颜色都消失了!

一开始以为是使用的行列数过多了原因。

查询资料后发现,13 版 excel 支持的大行数是 1048576,最大列数是 16384,我们使用的单元格数量还远没达到限制。

在经过更换图片、更换 excel 版本,修改代码等不充分各种测试,才找到问题的原因所在。

原来是因为,excel 的原形是由多个 xml 文件,填充的颜色都存储在一个 style.xml文件里面,当这个文件过大就会导致打开的时候报错。

所以为了解决这个问题,有两个解决方案,第一是缩小图片,第二是减少图片颜色。缩小图片的时候自带减少图片颜色的功能,减少图片颜色的方法可以采用灰度化、二值化等方法。

总体上来讲,就是需要控制 颜色数量*单元格数<阈值(3300w左右)

  1. MAX_WIDTH = 300

  2. MAX_HEIGHT = 300

  3. def resize(img):

  4. w, h = img.size

  5. if w > MAX_WIDTH:

  6. h = MAX_WIDTH / w * h

  7. w = MAX_WIDTH

  8. if h > MAX_HEIGHT:

  9. w = MAX_HEIGHT / h * w

  10. h = MAX_HEIGHT

  11. return img.resize((int(w), int(h)), Image.ANTIALIAS)

  12. 复制代码

最终效果

苍天不负有心人,打开最后输出的 excel 已经可以看到效果了!

所以说,一切能用 Python 解决的问题,最终都会用 Python 来解决。

全部代码

  1. # draw_excel.py

  2. from PIL import Image

  3. import openpyxl

  4. from openpyxl.styles import fills

  5. import os

  6. MAX_WIDTH = 300

  7. MAX_HEIGHT = 300

  8. def resize(img):

  9. w, h = img.size

  10. if w > MAX_WIDTH:

  11. h = MAX_WIDTH / w * h

  12. w = MAX_WIDTH

  13. if h > MAX_HEIGHT:

  14. w = MAX_HEIGHT / h * w

  15. h = MAX_HEIGHT

  16. return img.resize((int(w), int(h)), Image.ANTIALIAS)

  17. def int_to_16(num):

  18. num1 = hex(num).replace('0x', '')

  19. num2 = num1 if len(num1) > 1 else '0' + num1

  20. return num2

  21. def draw_jpg(img_path):

  22. img_pic = resize(Image.open(img_path))

  23. img_name = os.path.basename(img_path)

  24. out_file = './result/' + img_name.split('.')[0] + '.xlsx'

  25. if os.path.exists(out_file):

  26. os.remove(out_file)

  27. workbook = openpyxl.Workbook()

  28. worksheet = workbook.active

  29. width, height = img_pic.size

  30. for w in range(1, width + 1):

  31. for h in range(1, height + 1):

  32. if img_pic.mode == 'RGB':

  33. r, g, b = img_pic.getpixel((w - 1, h - 1))

  34. elif img_pic.mode == 'RGBA':

  35. r, g, b, a = img_pic.getpixel((w - 1, h - 1))

  36. hex_rgb = int_to_16(r) + int_to_16(g) + int_to_16(b)

  37. cell = worksheet.cell(column=w, row=h)

  38. if h == 1:

  39. _w = cell.column

  40. _h = cell.col_idx

  41. # 调整列宽

  42. worksheet.column_dimensions[_w].width = 1

  43. # 调整行高

  44. worksheet.row_dimensions[h].height = 6

  45. cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)

  46. print('write in:', w, ' | all:', width + 1)

  47. print('saving...')

  48. workbook.save(out_file)

  49. print('success!')

  50. if __name__ == '__main__':

  51. draw_jpg('mona-lisa.jpg')

附:

上面说到 颜色数量*单元格数<阈值(256^4左右)的时候,可能有人会有疑惑,这个 256^4是怎么来的。

这个当然是我测试信口开河得来的。

既然是有 颜色数量单元格数这两个变量,那么自然要有两个测试方法以上。一个观察 颜色数量,一个观察 单元格数

但我在这里只做了 颜色数量的一个测试。(最大的原因就是生成上万行*上万列的 excel 实在是太久了...懒...)

  1. count = 0

  2. MAX_WIDTH = 255

  3. for w in range(1, MAX_WIDTH + 1):

  4. for h in range(1, MAX_WIDTH + 1):

  5. cell = worksheet.cell(column=w, row=h)

  6. if h == 1:

  7. _w = cell.column

  8. _h = cell.col_idx

  9. # 调整列宽

  10. worksheet.column_dimensions[_w].width = 1

  11. # 调整行高

  12. worksheet.row_dimensions[h].height = 6

  13. if count < 255 ** 3:

  14. back = int_to_16(num=count)

  15. back = '0' * (6 - len(back)) + back

  16. else:

  17. back = ''.join([int_to_16(random.randint(0, 255)) for _ in range(3)])

  18. cell.fill = fills.PatternFill(fill_type="solid", fgColor=back)

  19. count += 1

count是记录颜色的变量,确保每一个颜色都不重复,但目前计算机 RGB 表示的颜色最多只有 256^3 种

通过调整 MAX_WIDTH的值来测试 excel 的阈值

最后生成的测试 excel 如下:

...还有点好看。!??


最后

由于精力有限 懒,能力也有限 菜,所以没有测试单一颜色的,也可能有其他的方法能没有这个阈值的限制。

代码已经全部上传至github,欢迎大家友好交流讨论 [握手]

后台回复【蒙娜丽莎】即可获取代码链接。本文原文链接:

签到送书计划

自律改变自我!第①期打卡送书活动启动!

我发起了一个签到送书活动,活动结束后将送出 5 本 Python 技术书。签到次数越多,中奖概率越高。活动详情,请点击:自律改变自我!第①期打卡送书活动启动!

下面是今天的签到二维码:

回复下方「关键词」,获取优质资源

回复关键词「 pybook03」,立即获取主页君与小伙伴一起翻译的《Think Python 2e》电子版

回复关键词「入门资料」,立即获取主页君整理的 10 本 Python 入门书的电子版

回复关键词「m」,立即获取Python精选优质文章合集

回复关键词「book 数字」,将数字替换成 0 及以上数字,有惊喜好礼哦~

推荐阅读

  • 2019年,大家都是怎么用 Pandas 的?

  • 一篇文章读懂 Python 多线程

  • 效率翻倍!再也不用手动改测试接口的参数了

  • 一行代码弄懂数据,pandas最佳搭档就是ta了

  • 让你赚钱更省力的 10 个开源项目!

题图:pexels,CC0 授权。

好文和朋友一起看~

本文标签: 用 Python 在 Excel 中画出蒙娜丽莎