亚洲精品美女久久久-亚洲精品毛片-亚洲精品伦理-亚洲精品乱码久久久久久写真-激情啪啪网站-激情欧美在线

網頁數據抓取之自動分類功能

2016-09-10 14:17:52 瀏覽:8107

我們在使用火車采集器進行數據抓取的時候,會需要將采集內容包含某個字的所有內容都替換為某個固定的內容。使用場景如:我們從網站采集城市名稱,然后城市名稱示例:浙江省杭州市,我們需要將這個內容替換為杭州,這時就可以使用自動分類功能。

下面以百度為例介紹下用法,首先在火車采集器V9建立規則,內容采集規則的標簽編輯如下:

1.png

 

如上圖,我們想要將包含百度的標題 內容更替換為常用搜索網站,則寫成如下格式:

2.png

 

運行結果為:

3.png

 

就是數據抓取時將某字段所有內容自動分類的使用方法,在操作需要注意的是

1一行一個分類,可以寫多個分類。若是一個關鍵詞符合多個分類,則優先替換上面的分類,火車采集器中是按照從上至下的原則替換。

2若是所有分類不符合的情況下,你想要將關鍵詞賦予為一個默認值,按下圖操作:

 

4.png


學會數據抓取的自動分類操作,對包含同類字段的內容進行分類就方便多了,大家也操作試試吧。

掃碼關注微信
主站蜘蛛池模板: 小腿垫东西睡觉正确图| 体温单的绘制及图解| 秦天柱| 生死相随| 学生会长的忠告| 薛昊婧演过的电视剧| 地震的现场急救原则包括| 陈浩宇女演员| 贝利亚头像,权威| 遍地狼烟| 底线演员表全部演员介绍| 墨雨云间电视剧免费播放| 南方车站的聚会| 蛋仔图片100张| 公主们的战国| 风间电影正版免费观看| 速度与激情 电影| 什么水果是热性的| 魅力游戏 第四季 电视剧| 焕羽电视剧免费播放在线观看| 女攻男受文| 沈敏| 我们的祖国是花园简谱| 床上黄色片| 迅雷 电影| 牛的交配视频| 羞羞片| 将夜电视剧免费观看完整版高清| 电影百度百科| 韩诗雅| 微信头像图片2024最新好看| 永久居留 电影| 桥梁工程施工方案| 卢靖姗的个人资料简介| 敦煌夜谭在线观看| 远大前程电影在线观看完整版| 苏捷斯卡战役 电影| 《她的城》电视剧| 都市频道节目表今天| 草逼的视频| 刘子菲|