admin管理员组文章数量:1130349
前端时间想看一些日更的电视剧, 但是网上找资源有点儿困难, google一圈儿之后发现了DHT和磁力链, 感觉是好东西, 但是能找到的搜索站基本都有些不和谐的小广告,用起来胆战心惊, 于是就想用自己之前买的虚拟机搭建一个纯净版的网站, 方便自己,也造福广大网友们.
目前网站已经试运行, http://www.91pph. 欢迎大家捧场.
下面说一下网站搭建流程:
- 购买虚拟主机, 比较坑的是有两种一种只能通过FTP上传文件,另外一种可以远程连接, 建议购买后者, 不然你会感觉很不爽.
- 备案, 比较麻烦, 但是国内建站都有这个要求, 而且服务提供商都有客服帮助你
- 编写DHT爬虫,我是用Python写的, 爬虫可以获取infohash码, 效率很高, 单线程一天也能搂个几万条
- 通过infohash获取种子文件信息, 这个繁琐的地方在于要了解bep_0010, bep_0009协议
- 有了infohash和文件信息就有了数据源,后面就是暂时的问题
- 我用PHP传递数据
- 后续考虑用Elasticsearch进行存储搜索,效率可能会好一些
对于理解BT有帮助的一些网站或者项目
- BT项目官网
前端时间想看一些日更的电视剧, 但是网上找资源有点儿困难, google一圈儿之后发现了DHT和磁力链, 感觉是好东西, 但是能找到的搜索站基本都有些不和谐的小广告,用起来胆战心惊, 于是就想用自己之前买的虚拟机搭建一个纯净版的网站, 方便自己,也造福广大网友们.
目前网站已经试运行, http://www.91pph. 欢迎大家捧场.
下面说一下网站搭建流程:
- 购买虚拟主机, 比较坑的是有两种一种只能通过FTP上传文件,另外一种可以远程连接, 建议购买后者, 不然你会感觉很不爽.
- 备案, 比较麻烦, 但是国内建站都有这个要求, 而且服务提供商都有客服帮助你
- 编写DHT爬虫,我是用Python写的, 爬虫可以获取infohash码, 效率很高, 单线程一天也能搂个几万条
- 通过infohash获取种子文件信息, 这个繁琐的地方在于要了解bep_0010, bep_0009协议
- 有了infohash和文件信息就有了数据源,后面就是暂时的问题
- 我用PHP传递数据
- 后续考虑用Elasticsearch进行存储搜索,效率可能会好一些
对于理解BT有帮助的一些网站或者项目
- BT项目官网
版权声明:本文标题:DHT磁力链数据爬取和资源搜索站的搭建 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://it.en369.cn/jiaocheng/1740361671a1756601.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。


发表评论