文件大小:10 MB。
Web数据挖掘是一种以表格形式从网页中提取有用数据的过程。Web Data Miner是一款出色的数据抓取工具,可自动执行数据挖掘工作。该工具的概念非常简单–减少了从网站抓取数据的手动工作。Web Data Miner的智能帮助用户从不同的布局网站(如购物,分类,基于产品的网站和其他网站)中提取准确的数据。它还包括两个更有用的功能:“外部链接”和“构造链接”,如果您希望在单个过程中从多个网站中提取内容,这些功能将非常有用。该软件的GUI非常吸引人,易于理解。
无论何时启动软件,都会显示“快速入门指南”。输入网站的URL后,它将在主屏幕上的网页浏览器中显示网页。网页加载完成后,用户可以单击“开始配置”按钮,然后单击要从网页上剪贴的项目。它可以从WebPages提取文本,html,图像,链接和URL。它允许用户提供用户定义的列名。
此数据抓取工具将从打开的网页中抓取单击的项目或类似项目。在此工具中,有两个选项“自动保存”和“自动暂停”。自动保存消除了数据丢失的风险,自动暂停消除了某些网站阻塞IP地址的风险。该Web数据挖掘工具可以从网站中的多个网页中挖掘数据。用户可以配置“设置下一页链接”,从所有网页中提取相似的数据。用户可以选择定义的页面数来提取数据,否则将从所有页面中挖掘数据。该软件的独特和最强大的功能是调度。用户可以设置时间和日期,并且必须提供配置文件。它将在用户定义的时间自动开始数据挖掘过程。
主要功能:
以表格形式从网页中提取数据。
从不同的布局网站提取数据。
从网页提取文本,html,图像,链接和URL。
从外部链接和自定义链接中提取数据。
自动跟随页面提取数据。
保存提取的数据以消除丢失数据的风险。
自动暂停可防止矿工被某些网站阻止。
将收藏的网站列表添加为书签。
用户可以安排将来的日期和时间来提取数据。
将数据保存为CSV,TXT格式。
下载地址
Download 百度网盘
链接: https://pan.baidu.com/s/1RXUm6gCwkNoxBDwza38h4Q 提取码: t7vi