1. GooSeeker -- 網頁抓?。畔⑻崛≤浖?、服務和技術知識庫

            請進新網站


            MetaSeeker應用領域

            網頁抓取/信息提取/數據抽取軟件工具包MetaSeeker V5.0.1正式發布,在線版免費下載和使用,源代碼可閱讀。Firefox 39.x 的配套版本已經發布(下載Firefox 39.0.3),如果使用中遇到問題請聯系我們。自推出以來,深受喜愛,主要應用領域:

            • 垂直搜索(Vertical Search):也稱為專業搜索,高速、海量和精確抓取是定題網絡爬蟲DataScraper的強項,每天24小時每周7天無人值守自主調度的周期性批量采集,加上斷點續傳和軟件看門狗(Watch Dog),確保您高枕無憂
            • 移動互聯網:手機搜索、手機混搭(mashup)、移動社交網絡、移動電子商務都離不開結構化的數據內容,DataScraper實時高效地采集內容,輸出富含語義元數據的XML格式的抓取結果文件,確保自動化的數據集成和加工,跨越小尺寸屏幕展現和高精準信息檢索的障礙。手機互聯網不是Web的子集而是全部,由MetaSeeker架設橋梁
            • 企業競爭情報采集/數據挖掘:俗稱商業智能(Business Intelligence),噪音信息濾除、結構化轉換,確保數據的準確性和時效性,獨有的廣域分布式架構,賦予DataScraper無與倫比的情報采集滲透能力,AJAX/Javascript動態頁面、服務器動態網頁、靜態頁面、各種鑒權認證機制,一視同仁。在微博網站數據采集和輿情監測領域遠遠領先其它產品。

            您需要同時從大量網站上采集內容嗎?
            您需要應對目標網站頁面結構頻繁變化嗎?
            您擁有一個工作組需要協同抓取網站內容嗎?
            您不斷編寫網站內容提取規則感覺很煩嗎?

            MetaStudio,語義標注和網站內容采集規則自動化生成工具,全圖形化界面,免編程自動生成數據抽取和格式化規則,采用多項專利技術,強力鎖定目標網站的內容結構,應對網頁結構變化,助力用戶業務的持續發展。

            MetaSeeker重大特色

            • MetaStudio是網頁數據抓取規則編輯器,免編程,只需要在圖形界面上的點選和標注,規則自動生成
            • MetaStudio是網頁數據抓取規則管理器,語義結構和抓取規則是個知識庫,規則生成不再是單程票,可以持續修改,適應業務發展需求
            • DataScraper是定題網絡爬蟲,單批量、周期性、無人值守多種運行模式,基于軟件看門狗的故障保護
            • DataScraper是網絡內容格式化工具,輸出富含語義元數據的結構化數據抓取結果(XML文件),二維表和樹形內容結構同時支持,確保強大的語義表述能力
            • DataScraper是高滲透力信息采集器,AJAX/javascript、動態內容、鑒權認證都不是障礙(不總是)
            • MetaSeeker是高協同開源商業情報采集網絡,跨地域分布式、動態IP地址、用戶接入線帶寬,與部署在中心機房的使用固定IP的解決方案相比,運營成本大大降低。

            GooSeeker發布的重要軟件工具

            • MetaStudio:網站內容語義標注和網頁數據提取規則生成工具,也是協同性網站內容語義結構管理工具
            • DataScraper:定題/聚焦網絡爬蟲、網頁數據提取和格式化工具,可組成跨地域分布式協同性信息采集網絡
            • MetaCamp:(僅限企業版)互聯網內容的語義結構知識庫,MetaSeeker用戶權限管理和協同管理服務器
            • DataStore:(僅限企業版)網頁數據提取規則數據庫
            • SliceSearch:(受限發布)異構數據對象綜合搜索引擎,可以快速部署垂直搜索、綜合搜索、對象搜索、實時搜索、手機推薦引擎等,實現了專利的精準搜索方法
            • SliceProfile:互聯網輿情監測和企業競爭情報分析系統,將自動化web數據采集、自動中文文本處理和檢索、自然語言處理(NLP)、數據挖掘和統計分析集成在一起,已經為消費電子、汽車、衛浴、金融等領域的多個企業客戶部署了該系統。
            欧美一级午夜福利免费区