关于Web页面导入
在知识管理 -> 知识维护 -> 知识库里面的“知识导入”功能里面选择“WEB页面”,可以将可访问的网页URL复制黏贴,进行导入。
在这里需要主要以下几点:
- 本功能仅针对当个页面,赞不提供首页自动全站爬取功能,后续将会支持;
- 因服务器在国内,所以不支持需要科学上网才能访问的页面,敬请谅解;
- 目前无法爬取动态加载的内容,也未对反爬机制做过优化,后续会进行加强。
另外,如您仅需对页面中某部分内容(如仅需新闻的标题和内容,无需菜单和相关文章列表等)进行导入,可使用“选择器”进行选择。 常用方法是在目标页面上右键选择“检查”,打开“开发者工具”,用鼠标选择需要的内容,可以在选择区块(颜色变化区域)的左上角看到选择器内容,如下图所示:
当您得到以上标签(上图中为div.news-detail),将该标签填入,即可爬取新闻标题和内容,而不会将其他无关内容导入,如下图所示:
后续我们计划升级该功能,将选取导入工作全部变成鼠标点击操作方式,便于用户操作。