基于python英文文件名批量翻译并重命名-369IT编程

admin管理员组
文章数量:1130349

下载了一些英文PDF文章，想把它们翻译一下文件名，并且以英文名_翻译中文重命名。

调用百度翻译api，在百度翻译开放平台注册通用翻译API-标准版，是免费的。

http://fanyi-api.baidu/api/trans/product/desktop

申请时服务器，我填了个本机的ip，会报错

58000

客户端IP非法

检查个人资料里填写的 IP地址是否正确，可前往管理控制平台修改

我修改成空后，demo就不报错了，所以服务器地址最好不填。

申请好后，拉倒网址页面最下面，记录

申请信息

APP ID：

密钥：

#-*- coding:UTF-8 -*-
import cv2
import os
import re
import numpy as np
from glob import glob
import requests
import urllib.request
import time
import urllib
import urllib.parse
import random
import requests
import random
import json
from hashlib import md5
import time
# Set your own appid/appkey.输入你自己的通用翻译api-标准版
appid = 'INPUT_YOUR_APPID' 
appkey = 'INPUT_YOUR_APPKEY'

# For list of language codes, please refer to `https://api.fanyi.baidu/doc/21`
from_lang = 'en'
to_lang =  'zh'

endpoint = 'http://api.fanyi.baidu'
path = '/api/trans/vip/translate'
url = endpoint + path

#query = 'Dynamic hardware system for cascade SVM classification of melanoma'

# Generate salt and sign
def make_md5(s, encoding='utf-8'):
    return md5(s.encode(encoding)).hexdigest()

salt = random.randint(32768, 65536)


# Build request
headers = {'Content-Type': 'application/x-www-form-urlencoded'}
#把pdf文章放在main.py目录下的./1/文件夹
video_path = "./1/"
frames = glob(os.path.join(video_path, '*.pdf'))

for i, frame in enumerate(frames):
    pattern = repile(r'([^<>/\\\|:""\*\?]+)\.\w+$')
    data = pattern.findall(frame)
    data_now = data[0]
    print(data_now)
    query = data_now
    sign = make_md5(appid + query + str(salt) + appkey)
    payload = {'appid': appid, 'q': query, 'from': from_lang, 'to': to_lang, 'salt': salt, 'sign': sign}
    # Send request
    r = requests.post(url, params=payload, headers=headers)
    result = r.json()
    if(r.text.find('trans_result')>=0):
        result1=result['trans_result'][0]['dst']
        # Show response
        #print(json.dumps(result, indent=4, ensure_ascii=False))
        print(result1)
        os.rename(video_path+data_now+".pdf",video_path+data_now+"_"+result1+".pdf")    
    #延迟2-3s，不然会出现54003错误 访问频率受限
    time.sleep(3)

有大神写成了软件，https://www.52pojie/thread-1482332-1-1.html 还是相当好用的

·········································································································

期间也试了下抓包分析有道翻译，百度翻译，逆向解析sign，

超详细百度翻译js逆向（token 和 sign）_小生听雨园的博客-CSDN博客

JS逆向必会基础案例 | 百度翻译参数破解_shine4869的博客-CSDN博客

GitHub - Xuenew/Python_Spider_All: 每完成一个项目存储一个欢迎添加

能用是能用，但是发现翻译字数有限，超出就会报{"errno":998,"errmsg":"\u672a\u77e5\u9519\u8bef"

·············································································································

还试了金山翻译有反爬机制，所以放弃，signitual自己也不会逆向。

http://www.iciba/

#-*- coding:UTF-8 -*-
import cv2
import os
import re
import numpy as np
from glob import glob
import requests
import urllib.request
import time
import urllib
import urllib.parse
import random
headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
}

video_path = "./1/"
frames = glob(os.path.join(video_path, '*.pdf'))

for i, frame in enumerate(frames):
    pattern = repile(r'([^<>/\\\|:""\*\?]+)\.\w+$')
    data = pattern.findall(frame)
    data_now = data[0]
    print(data_now)
    url_code_name = urllib.parse.quote(data_now)
    print(url_code_name)
    html = requests.get("http://www.iciba/word?w="+url_code_name,headers=headers)
    #decode = html.content.decode('gbk','ignore')
    u = html.content.decode('utf-8')
    print(u)
    name=re.findall(r'<p>(.*?)</p>',u)
    print(name)
    os.rename(video_path+data_now+".pdf",video_path+data_now+name[0]+".pdf")

金山词霸get请求运行了一会后，现在浏览器直接访问都打不开网页了。方案pass。

下载了一些英文PDF文章，想把它们翻译一下文件名，并且以英文名_翻译中文重命名。

调用百度翻译api，在百度翻译开放平台注册通用翻译API-标准版，是免费的。

http://fanyi-api.baidu/api/trans/product/desktop

申请时服务器，我填了个本机的ip，会报错

58000

客户端IP非法

检查个人资料里填写的 IP地址是否正确，可前往管理控制平台修改

我修改成空后，demo就不报错了，所以服务器地址最好不填。

申请好后，拉倒网址页面最下面，记录

申请信息

APP ID：

密钥：

#-*- coding:UTF-8 -*-
import cv2
import os
import re
import numpy as np
from glob import glob
import requests
import urllib.request
import time
import urllib
import urllib.parse
import random
import requests
import random
import json
from hashlib import md5
import time
# Set your own appid/appkey.输入你自己的通用翻译api-标准版
appid = 'INPUT_YOUR_APPID' 
appkey = 'INPUT_YOUR_APPKEY'

# For list of language codes, please refer to `https://api.fanyi.baidu/doc/21`
from_lang = 'en'
to_lang =  'zh'

endpoint = 'http://api.fanyi.baidu'
path = '/api/trans/vip/translate'
url = endpoint + path

#query = 'Dynamic hardware system for cascade SVM classification of melanoma'

# Generate salt and sign
def make_md5(s, encoding='utf-8'):
    return md5(s.encode(encoding)).hexdigest()

salt = random.randint(32768, 65536)


# Build request
headers = {'Content-Type': 'application/x-www-form-urlencoded'}
#把pdf文章放在main.py目录下的./1/文件夹
video_path = "./1/"
frames = glob(os.path.join(video_path, '*.pdf'))

for i, frame in enumerate(frames):
    pattern = repile(r'([^<>/\\\|:""\*\?]+)\.\w+$')
    data = pattern.findall(frame)
    data_now = data[0]
    print(data_now)
    query = data_now
    sign = make_md5(appid + query + str(salt) + appkey)
    payload = {'appid': appid, 'q': query, 'from': from_lang, 'to': to_lang, 'salt': salt, 'sign': sign}
    # Send request
    r = requests.post(url, params=payload, headers=headers)
    result = r.json()
    if(r.text.find('trans_result')>=0):
        result1=result['trans_result'][0]['dst']
        # Show response
        #print(json.dumps(result, indent=4, ensure_ascii=False))
        print(result1)
        os.rename(video_path+data_now+".pdf",video_path+data_now+"_"+result1+".pdf")    
    #延迟2-3s，不然会出现54003错误 访问频率受限
    time.sleep(3)

有大神写成了软件，https://www.52pojie/thread-1482332-1-1.html 还是相当好用的

期间也试了下抓包分析有道翻译，百度翻译，逆向解析sign，

超详细百度翻译js逆向（token 和 sign）_小生听雨园的博客-CSDN博客

JS逆向必会基础案例 | 百度翻译参数破解_shine4869的博客-CSDN博客

GitHub - Xuenew/Python_Spider_All: 每完成一个项目存储一个欢迎添加

能用是能用，但是发现翻译字数有限，超出就会报{"errno":998,"errmsg":"\u672a\u77e5\u9519\u8bef"

还试了金山翻译有反爬机制，所以放弃，signitual自己也不会逆向。

http://www.iciba/

#-*- coding:UTF-8 -*-
import cv2
import os
import re
import numpy as np
from glob import glob
import requests
import urllib.request
import time
import urllib
import urllib.parse
import random
headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
}

video_path = "./1/"
frames = glob(os.path.join(video_path, '*.pdf'))

for i, frame in enumerate(frames):
    pattern = repile(r'([^<>/\\\|:""\*\?]+)\.\w+$')
    data = pattern.findall(frame)
    data_now = data[0]
    print(data_now)
    url_code_name = urllib.parse.quote(data_now)
    print(url_code_name)
    html = requests.get("http://www.iciba/word?w="+url_code_name,headers=headers)
    #decode = html.content.decode('gbk','ignore')
    u = html.content.decode('utf-8')
    print(u)
    name=re.findall(r'<p>(.*?)</p>',u)
    print(name)
    os.rename(video_path+data_now+".pdf",video_path+data_now+name[0]+".pdf")

金山词霸get请求运行了一会后，现在浏览器直接访问都打不开网页了。方案pass。

本文标签：英文文件名批量 python

版权声明：本文标题：基于python英文文件名批量翻译并重命名内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://it.en369.cn/jiaocheng/1764014779a2979523.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

369IT编程

基于python英文文件名批量翻译并重命名

更多相关文章

python+百度翻译api制作中英文互转的代码应用实例

python界面英文翻译_Python编辑器英文菜单的中文翻译及解释，看看吧，磨刀不误砍柴工...

英文期刊论文翻译格式要求和文献要求

基于神经机器翻译(NMT)实现：英文到中文翻译（python代码可直接运行）

PPT文档英文怎么翻译成中文？文档英文翻译这一招就够了

android中自动翻译你看不懂的英文代码插件，让你实现在androistudio中学习英语！！

使用 Helsinki-NLP 中英文翻译本地部署 - python 实现

老人与海好词100英文带翻译_老人与海 英文版经典句子

英文文献翻译神器SCITranslate V17--一键翻译整篇文献

Python制作翻译软件（中英文互译）

英文阅读必备——说说那些翻译软件

【工具】怎么将英文网页整篇翻译成中文

各种英文翻译汇总（包含pdf翻译，主要针对英文论文）

【zotero】参考文献要求双语，即中文文献需翻译成英文

英文pdf翻译为中文（word+google浏览器即可）

Python编程经常用到的英语及翻译

python数据分析用什么笔记本-学Python买什么笔记本电脑？

笔记本电脑下载python视频-学Python买什么笔记本电脑？

Python数据分析是什么？为什么要对比Excel学习Python数据分析？

在win7 32位系统中安装配置Python的机器学习包scikit-learn

发表评论

推荐文章

win10连接android手机助手下载,完美Win10手机助手电脑版

正常App被标记为病毒解决思路

【收纳】整理收纳师与私人管家 | 整理一个家，也是帮主人梳理生活

联通定制机酷派7728root方法（含工具）其它版本通用

elasticsearch国内镜像下载

热门文章

FlinkSQL之temporary join开发

搜苹果ipad版_苹果iPhoneiPad升级错误进入恢复模式，代码14，应该如何处理？

账号泄露如何检测查询

U788ROOT及刷机包--移动定制版中兴…

Windows下搭建kms激活服务器

Docker Swarm 节点维护

mac安装搜狗输入法

【免费下载】 AutoCAD ActiveX 和 VBA 参考文档（明经通道版）：助力AutoCAD二次开发的利器

把数字翻译成英文声明.C语言,如何把数字翻译成英文

工具插件：IDEA英文翻译工具（Translation）

最新文章

Sublime 32位 激活码

windows下载安装远程桌面工具RealVNC-Server教程(RealVNC_E4_6_1版带注册码)

【亲测免费】 抖音直播伴侣推流密钥获取工具使用教程

【亲测免费】 Proxifer 安装包与注册码

Royal TSX许可证密钥(6.x后所有版本都可以用)

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

WordPress get parent category taxonomy

Omit specific product categories from WooCommerce shortcode

Updating Posts table in database without overwriting user generated content

php - Use wp_get_recent_posts with search term

responsive - How to exclude an image size from the Wordpress srcset

老人与海好词100英文带翻译_老人与海英文版经典句子

Sublime 32位激活码

【亲测免费】抖音直播伴侣推流密钥获取工具使用教程