项目总结之 wizag | idouba

项目总结之 wizag

在整理资料的时候发现了移动硬盘中存储的研究生时期做的一个项目的相关文档。 在这个项目中比较深刻的理解了信息检索的理论、实践。涉及information retrieval中重要的分词、权重计算等技术点。最终的效果也被证明很不错。从信息检索的理论的运用角度来说是成功的,这个都是Ping教授的功劳,分词算法包括逻辑都是他提供并且指导我们完善的。因为能够近似语义一样的自动提取一篇文章的中的关键字,作为一个插件的功能挺多人推崇。但是从项目的角度来说是不成功的。因为参与项目的同事同学的技术能力,提供的服务性能问题、产品的持续改善能力严重不足。

在研究生时候方向是数据(存储、数据库、数据挖掘),很感激碰到这个项目,形成或者改变了自己的技术方向。经常会回想起这个项目中梁老师在做项目的过程中教会的信息检索的理论实践。但是这个项目最终的效果不太满意,所以一直想找时间自己好好的就这技术这块总结一下。@TODO

从项目的发起人,加州大学的一位计算机科学家Ping老师的对项目的描述。关键字就两个:是信息的Discovery & Aggregate。

核心的功能就是,对一定的资源上的文章自动提取关键字,并按照关键字对文章进行聚类。这个过程在Wizag.com – Widget for blog exposure被称为auto-tags。文章可以是来自权威的rss feeds,如cnn,abc,yahoo,也可以是各种用户订阅的rss feeds, 或者作为一个wiget添加到用户博客中。

在宣传上,我们说Wizag(http://Wizag.com)是一种主题发现和兴趣学习引擎。能够从大量的文章中提取用户认为重要的主题,并将文章排名、分类、按照用户感兴趣的主题进行过滤。通过提取的关键字来表达文章内容。甚至在发现前面加上Wizag offers semantic analysis.

 

相关资料:

Personalized News Discovery and Visualization, Diggol Launches Hot Topics and TopicMap

Wizag offers semantic analysis, attention to RSS

Diggol helps you profile and organize the information on the Internet

http://techcrunch.com/2006/08/01/wizag-offers-semantic-analysis-attention-to-rss/

http://www.prweb.com/releases/2006/06/prweb399333.htm

http://forums.searchenginewatch.com/archive/index.php/t-7437.html

http://www.killerstartups.com/blogging-widgets/wizag-com-widget-for-blog-exposure/#ixzz1DpUAEy7k

http://mashable.com/2007/06/18/wizwag/

http://www.webproworld.com/webmaster-forum/threads/39357-Diggol-Intelligent-Information-Mining-tool

http://scoutness.com/diggol-helps-you-profile-and-organize-the-information-on-the-internet/

原创文章。为了维护文章的版本一致、最新、可追溯,转载请注明: 转载自idouba

本文链接地址: 项目总结之 wizag


, ,

Trackbacks/Pingbacks

  1. Data Mining 笔记&实践 | 学而时习之 - 2016年4月6日

    […] 项目总结之 wizag […]

发表评论