• 樂思軟件

    提交需求|聯系我們| 請電400-603-8000

    研發

    目前,由于因特網的迅猛發展,國際上對于網絡內容挖掘(Web Content Mining)與網絡情報監測(Web Intelligence Monitoring)的研究越來越重視,研究者也越來越多。樂思軟件以應用研究的角度,不斷跟蹤最新的理論成果與研究動向,不斷學習實驗融匯,開發出觀念更新穎、功能更強大的信息處理工具軟件。

    領先的網絡數據采集技術

    我們的網絡數據采集技術是建立在我們自己的理論與實踐之上的。 我們自己的理論基于對全球范圍內的網絡信息采集研究學術論文的研究和我們的理論探索。 我們自己的實踐便是多年從事網絡數據采集服務分析處理上千個不同類型網站的實際經驗。在研究初期,我們從以下幾篇重要論文得到了啟發:

    大規模超文本搜索引擎Google的技術原理
    The Anatomy of a Large-Scale Hypertextual Web Search Engine
    該文為關于現代搜索引擎的經典論文,在1998年由還在Stanford的Google創始人Sergey Brin與Lawrence Page作為博士論文發表。文中提出兩個重要技術:其一為將全球分散的因特網網頁集中存儲與索引的實現技術,其二為利用網頁間相互鏈接的信息,網頁內部的文本語義信息與結構信息來提高檢索結果的質量。

    從半結構化文本與自由格式文本中學習信息抽取規則
    Learning Infomation Extraction Rules For Semi-Structured and Free Text 作者Stephen
    Soderland為華盛頓州立大學計算機科學系教授。本文的被引用次數高達50多次。論文以信息抽取系統WHISK系統為例,描述了如何以機器學習的方式,利用小規模樣本訓練系統自動學習目標文本的抽取模式,從而實現自動化信息抽取的一種技術。這種技術不但極具啟發意義而且很有實用價值。

    從WWW中抽取模式與關系
    Extracting Patterns and Relations from the World Wide Web
    這是Sergey Brin的另外一篇力作。該論文提出一種叫DIPRE的方法,利用機器學習理論從大量文本中自動提取模式與關系。文中利用這種方法從互聯網上分散的文本中提取圖書信息,即作者,標題二元組。結果僅用了5本書的樣本集,就自動擴展到了15,000本書,而且有些書是最大的網上書店亞馬遜也沒有的。

    領先的軟件工程

    樂思軟件通過面向客戶的軟件開發過程捕獲潛在用戶的真正需求并準確理解,在開發之前形成系統設計模型說明書,像建造一棟大廈一樣先勾畫出軟件的功能設計藍圖與界面設計藍圖,便于與用戶一起溝通獲取用戶的反饋意見,以精確控制項目的范圍與具體目標,提高用戶的滿意度。 樂思軟件的軟件開發流程遵循微軟發布的微軟解決方案框架,以保證產品研發的穩定進行,成功完成。

    微軟MSF模型
    圖1 微軟解決方案框架

    樂思軟件通過的層次化組件化的方式設計產品應用軟件并加以實現。

    企業開發層次化模型
    圖2 應用軟件的層次化組件化模型

    11选5开奖结果走势图