今天发现了一个特别棒的工具—huginn,很实用,应用范围很广,确实是网络工具库中的神器。它可以监控网络上的一切资源,并将这些资源按照你的需要发送给你。实现这一功能只需要简单的配置就可以了。列举一下,huginn主要的应用场景和功能。
1跟没有RSS的网站定制RSS种子
2监控知乎、微博、贴吧等平台指定的信息,一旦监控到信息,邮件通知你本人
3监控各大购物平台商品信息,一旦发现折扣信息,邮件通知你
4支持各种形式的发送和接收WebHooks。
Huginn就是私有的IFTTT,自定义程度非常高,只要你思路开阔,想法够野一定能发挥出巨大的价值。
Huginn的安装方法有很多种,我推荐一种,就是通过docker安装。原因很简单,安装快,而且这本身就是docker的主要应用场景和优势所在。如果是常规安装方式,需要安装依赖包、ruby环境、数据库、nginx、huginn及各种配置;但是docker就只需要下载docker镜像,运行huginn容器就可以了。
建议最低配置为1G内存、1核CPU。推荐使用vultr的基础款云服务器,自带一键安装docker功能。均采用千兆带宽、SSD硬盘,稳定性有保障,按小时计费,随用随停,且支持支付宝付款。而且vultr现在还有注册送100美元的活动,参考:VULTR2020年优惠,新用户直接送100美元,附额外领3美元教程
推荐阅读:月付3-7刀,质量口碑保证,网络线路优秀的vps盘点
Centos7安装docker命令如下:
curl-fsSLhttps://get.docker.com/|sh
注:安装docker要求系统内核版本高于3.0,基本上只能安装在KVM架构的vps上。
dockerrun?--namehuginn?-p3000:3000huginn/huginn
注:重启容器会导致数据丢失,请勿轻易应用到生产环境。
部署成功后访问IP+3000端口,出现界面,点击登录,默认账号密码是admin/password.登录成功后,界面如下
Huginn使用介绍-以websiteagent采集网页为例

1新建一个agent,负责每隔一分钟采集v2ex第一个帖子的标题,配置如下。点击agents->newagent.
tpye选择websiteagent,表示从web站点采集数据;
schedule表示多久采集一次,本次设置的是每分钟一次
其他的暂时不用管,重要的是配置option,即从v2ex采集第一个帖子的规则。
需要配置采集地址url,即v2ex首页的网址;v2ex第一个帖子的css定位,可以通过f12查看帖子的xpath,下图所示。
但是获取的xpath经常有问题,推荐通过selectorgadgetchrome扩展去获取定位;再配置获取的内容,我是获取的文字内容,填normalize-space(.)即可
最后点击“dryrun”测试一下是否可以获取到内容,下图所示即成功。点击save,保存该agent
运行几分钟后,可以看到每分钟都能获取到新的v2ex帖子。
通过以上v2exagent实现了每隔一分钟检测一次首页第一个帖子。然后再尝试一下将v2exagent中的内容通过邮件发布。
需要另外新建一个agent,type选择EmailAgent,sources选择我们之前创建的v2exagent,options中填邮件内容,我们通过{{title}}引入了v2exagent中的title字段。这样v2exagent每次检测到内容更新,就会触发emailagent,将更新的内容通过邮件发送到本人。
还需要配置邮件发送接收相关内容。
首先要配置配置stmp服务器。然后将stmp配置信息写到huginn容器的环境变量中去。所以需要用以下方式启动huginn容器。
补充:stmp服务器配置可以参考:https://www.vpsjxw.com/vps_use/stmp_python/
-eSMTP_USER_NAME=AAAAAA@163.com\
-eSMTP_PASSWORD=password\
-eSMTP_SERVER=smtp.163.com\
-eEMAIL_FROM_ADDRESS=AAAAAA@163.com\
点击界面右上角的account,将默认的邮箱admin@example.com,改为接收邮箱号,邮件配置就完成了
本文来源:国外服务器--数据监控的一般流程是什么
本文地址:https://www.idcbaba.com/guowai/1574.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 1919100645@qq.com 举报,一经查实,本站将立刻删除。