GooSeeker
產品
資源
教程
視頻教程
使用交流
資訊
開啟輔助訪問
切換風格
請
登錄
后使用快捷導航
沒有帳號?
立即注冊
登錄
|
注冊
快捷導航
搜索
搜索
本版
文章
帖子
用戶
資訊
常見問題
使用交流
python交流
視頻教程
資源發布公告
數學建模交流
論壇
›
搜客社區
›
資源發布公告
0
14916
知乎數據采集攻略
shenzhenwan10
于 2016-12-29 14:42
發表
[復制鏈接]
[只看樓主]
[打印]
[上一主題]
[下一主題]
shenzhenwan10
積分
2842
精華
0
威望
1160
金錢
2
最后登錄 1970-1-1
加為好友
發送消息
訪問家園
本帖最后由 HJLing 于 2017-1-6 16:23 編輯
知乎
數據采集攻略如下(
綠框是頁面名稱,橙色字體是采集結果表中的網址字段或瀏覽器地址欄復制的網址
):
1、采集“
知乎_關鍵詞搜索結果列表_內容
”
方法:
用瀏覽器訪問
知乎搜索頁面
, 輸入搜索關鍵詞, 點擊"搜索", 點擊子頁面"內容"
把瀏覽器地址欄的網址復制, 在數據DIY
知乎_關鍵詞搜索結果列表_內容
添加進去, 點擊"獲取數據"
從“知乎_關鍵詞搜索結果列表_內容”
展開采集更多頁面信息
方法:從“
知乎_關鍵詞搜索結果列表_內容
”的數據表中,把“詳情鏈接”這列的網址拷貝出來,然后點擊“
知乎_獨立問題所有回復采集
”的“輸入多條網址”按鈕,粘貼網址,就可以用后者實現批量數據采集。其它頁面類似。
注意:用戶主頁鏈接需要自己在excel中拼上前面的域名“
https://www.zhihu.com
”才能作為線索添加。
2、采集“
知乎_關鍵詞搜索結果列表_話題
”
方法:
用瀏覽器訪問
知乎搜索頁面
, 輸入搜索關鍵詞, 點擊"搜索", 點擊子頁面"話題"
把瀏覽器地址欄的網址復制, 在
數據DIY知乎_關鍵詞搜索結果列表_話題
添加進去, 點擊"獲取數據"
3、從“知乎_獨立話題首頁”
展開采集更多頁面信息
方法:從“
知乎_獨立話題首頁
”的數據表中,把“話題動態鏈接”這列的網址拷貝出來,然后點擊“
知乎_獨立話題動態內容采集
”的“輸入多條網址”按鈕,粘貼網址,就可以用后者實現批量數據采集。其它頁面類似。
4、從“知乎_獨立話題動態內容采集”
展開采集更多頁面信息
方法:從“
知乎_獨立話題動態內容采集
”的數據表中,把“精華鏈接”這列的網址拷貝出來,然后點擊“
知乎_獨立話題精華內容采集
”的“輸入多條網址”按鈕,粘貼網址,就可以用后者實現批量數據采集。其它頁面類似。
注意:用戶主頁鏈接需要自己在excel中拼上前面的域名“
https://www.zhihu.com
”才能作為線索添加。
5、從“知乎_獨立話題精華內容采集”
展開采集更多頁面信息
方法:從“
知乎_獨立話題精華內容采集
”的數據表中,把“精華鏈接”這列的網址拷貝出來,然后點擊“
知乎_獨立話題動態內容采集
”的“輸入多條網址”按鈕,粘貼網址,就可以用后者實現批量數據采集。其它頁面類似。
注意:用戶主頁鏈接需要自己在excel中拼上前面的域名“
https://www.zhihu.com
”才能作為線索添加。
6、從“知乎_獨立話題等待回答采集”
展開采集更多頁面信息
方法:從“
知乎_獨立話題等待回答采集
”的數據表中,把“精華鏈接”這列的網址拷貝出來,然后點擊“
知乎_獨立話題動態內容采集
”的“輸入多條網址”按鈕,粘貼網址,就可以用后者實現批量數據采集。其它頁面類似。
7、從“知乎_用戶詳情資料采集”
展開采集更多頁面信息
方法:從“
知乎_用戶詳情資料采集
”的數據表中,把“他關注的人的鏈接”這列的網址拷貝出來,然后點擊“
知乎_他關注的人列表采集
”的“輸入多條網址”按鈕,粘貼網址,就可以用后者實現批量數據采集。其它頁面類似。
【附注】
在
數據DIY
上可以找到很多網站下不同頁面的采集入口,只要與樣例網址是相同級別的網頁,就可以用該頁面的采集入口采集數據。因此,如果從數據DIY某個頁面采集到網址,那么就可以找到該網址對應頁面的采集入口,把批量網址添加進去,這也是數據DIY的出發點,讓用戶可以組合任意頁面進行批量采集。
本帖子中包含更多資源
您需要
登錄
才可以下載或查看,沒有帳號?
立即注冊
x
收藏
0
轉播
支持
3
反對
0
舉報
使用道具
|
回復
共 0 個關于本帖的回復 最后回復于 2022-5-3 10:26
返回列表
B
Color
Image
Link
Quote
Code
Smilies
高級模式
您需要登錄后才可以回帖
登錄
|
立即注冊
發表回復
回帖并轉播
回帖后跳轉到最后一頁
回復
推薦板塊
使用交流
常見問題
數學建模交流
python交流
視頻教程
精彩推薦
對共詞關系求協方差矩陣后再用Girvan-Newma
社區發現算法Girvan-Newman(GN)是否能應用
使用GooSeeker分詞和Gephi進行中文文本分析
Gephi社會網絡分析-網絡圖的統計
范文:亞運短視頻對杭州城市形象的建構研究
熱門話題
1
【集微庫】微博采集工具箱使用常見問題
2
集搜客文本分詞標注工具(V1版)
3
有沒有辦法采集機場的出租車信息?
4
【求助】關于采集阿里巴巴國際站訪客詳情分
5
獲得積分的好方法:轉發小程序、QQ群、微信
6
怎樣使用快捷采集(以采集京東評論為例)
7
GooSeeker分詞,情感分析和關鍵詞抽取平臺使
8
新浪微博_博主主頁
9
集搜客GooSeeker 網絡爬蟲版本發布公告
10
貓途鷹的評論星級抓取不成功,只有與我樣本
熱門用戶
Fuller
帖子:9974
訪問主頁>>
wangyong
帖子:1674
訪問主頁>>
gbkuce
帖子:0
訪問主頁>>
GMT+8, 2022-11-23 11:05
快速回復
快速發帖
返回頂部
返回列表
欧美一级午夜福利免费区
共 0 個關于本帖的回復 最后回復于 2022-5-3 10:26