admin管理员组文章数量:1026472
项目简介
- 前端站点 项目效果预览 http://findcl
- 使用 nodejs 实现磁力链接爬虫 磁力链接解析成 torrent种子信息,保存到数据库,利用 Elasticsearch 实现中文检索。koa2 搭建磁力链接搜索引擎
- 源码地址 https://github/ssstk/findcl
- 后端脚本 磁力链接获取 磁力链接解析 入库 Mongodb 定时同步 Elasticsearch
- 源码地址 https://github/ssstk/mang...
- 此项目仅用学习交流技术使用 不做商业用途。
上线
- 2018-06-01 网站正式上线。暂时想不到什么名字 各位大大可以推荐下哦。域名是 http://findcl ,
- 两台 VPS (都是某些云做活动买的 配置低)
- 第一台部署了 FindCl 站点本身( koa2、nginx )和单个节点的 Elasticsearch
- 第二台部署了磁力链接爬虫 hashinfo 解析 入库 Mongodb
- Mongodb 数据库在套路云(目前有 300W 数据库,每日新收录 3W+的数据)
项目依赖
- Mongodb
- mongoose
- Elasticsearch
- nginx
- koa2
- vue
- DHT BT 资源爬虫 磁力链接解析 manget2torrent
- crontab 定时执行 Mongodb 与 Elasticsearch 的数据同步
- ...
存在的问题
manget2torrent
- 依赖的 dhtspider 爬虫 长时间使用一个端口的时,由于 P2P 网络的特性,越来越多的节点来访问 会导致带宽跑满(其主要是活动买的云主机 1M 的),如果活力全开不做闲置 大概稳定在 10M 左右。解决方案就是 每次采集 5000 条不重复的磁力 hashindo 就暂停爬虫,取解析获取信息。等小于 1000 条时候,再随机端口开启服务。
- 解析磁力链接缓慢且成功率很低, 失败的大概在 3 成左右且需要好几秒
其他
有其他问题请新建issue交流。
项目简介
- 前端站点 项目效果预览 http://findcl
- 使用 nodejs 实现磁力链接爬虫 磁力链接解析成 torrent种子信息,保存到数据库,利用 Elasticsearch 实现中文检索。koa2 搭建磁力链接搜索引擎
- 源码地址 https://github/ssstk/findcl
- 后端脚本 磁力链接获取 磁力链接解析 入库 Mongodb 定时同步 Elasticsearch
- 源码地址 https://github/ssstk/mang...
- 此项目仅用学习交流技术使用 不做商业用途。
上线
- 2018-06-01 网站正式上线。暂时想不到什么名字 各位大大可以推荐下哦。域名是 http://findcl ,
- 两台 VPS (都是某些云做活动买的 配置低)
- 第一台部署了 FindCl 站点本身( koa2、nginx )和单个节点的 Elasticsearch
- 第二台部署了磁力链接爬虫 hashinfo 解析 入库 Mongodb
- Mongodb 数据库在套路云(目前有 300W 数据库,每日新收录 3W+的数据)
项目依赖
- Mongodb
- mongoose
- Elasticsearch
- nginx
- koa2
- vue
- DHT BT 资源爬虫 磁力链接解析 manget2torrent
- crontab 定时执行 Mongodb 与 Elasticsearch 的数据同步
- ...
存在的问题
manget2torrent
- 依赖的 dhtspider 爬虫 长时间使用一个端口的时,由于 P2P 网络的特性,越来越多的节点来访问 会导致带宽跑满(其主要是活动买的云主机 1M 的),如果活力全开不做闲置 大概稳定在 10M 左右。解决方案就是 每次采集 5000 条不重复的磁力 hashindo 就暂停爬虫,取解析获取信息。等小于 1000 条时候,再随机端口开启服务。
- 解析磁力链接缓慢且成功率很低, 失败的大概在 3 成左右且需要好几秒
其他
有其他问题请新建issue交流。
版权声明:本文标题:nodejs 实现 磁力链接资源搜索 BT磁力链接爬虫 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://it.en369.cn/jiaocheng/1740361565a1756581.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论