2012年08月05日,Iveely Search Engine 0.1.0发布,今天,怀着对于未来的追求,终于,0.7.0如期和大家见面了,7个版本,历时2年4个月,感谢大家的支持,感谢我不离不弃的战友魏琪,奋斗到深夜,放弃了周末的社交,就为0.7.0如期而至;感谢Bogdan P Sliwowski先生,您的支持,让我们的激情和梦想靠得越来越近。下载安装编译部署,请参考Github,Web访问的时候,请确定您的浏览器支持WebSocket。
此次的版本,最大的技术改变是将纯C#迁移到了纯Java,由于是第一次迁移至Java且由于Java功底不好,所以,代码难免有不足之处,还请大家多多谅解。如果您有比较好的建议可以在这里提供给我们。整个项目由Iveely.Framework和Iveely.Computing以及Iveely.Search组成,Iveely.Search是基于Iveely.Computing的应用。Iveely.Framwork是一切程序的基础。本次版本包含了四大功能:文本检索、图像检索、百科检索、问答检索,其中问答检索是核心。下面看一下整体效果截图:
1. 1 文本检索功能
1.2 图片搜索
1.3 百科搜索
1.4 问答搜索
问答搜索一直是我们的核心业务,我们绝大部分时间和精力都集中在这里,不过还好,目前看,部分数据的效果还是不错的。
当然还有移动客户端的搜索结果:
以上均是无监督自我学习数据产生,但是由于服务器和数据量有限,某些结果不是很满意,当然我们也会积极改进。
1.2 技术窥视
在这里介绍详细的技术细节,可能不太现实。Iveely.Computing是整个程序运行的基础,也是让Iveely.Search变成分布式结构的运行平台,这点和0.6.0中C#版本有一定的改变,0.6.0种Iveely.Computing是一个分布式计算平台,可以进行多台机器计算一个任务,例如100亿个数相加。但是在0.7.0中,我们移除了这部分,因为我们也许不是去重新实现一个storm,以我们的实力和精力,是不够的,何况偏离了我们核心的业务,我们需要专注于我们需要实现什么,所以我们让Iveely.Computing更佳符合Iveely.Search的规范,多台机器协同工作,可以控制运行数据,拥有分布式缓存,目前则足以。
也许您很关心,Iveely能否能够像其它开源搜索引擎一样正常长期运行,这点,我们经过了严格测试,7*24小时无监督搜集数据和上线新数据,并提供服务。由于服务器的关系,我们在开源社区的示例,只提供了少量数据,我们的服务器上也只提供了少量数据。
对于专业的搜索引擎开发者,也许您更关心,如何搜集用户的行为数据,为广告投放和个性化搜索提供帮助?您可以很轻易的修改代码实现,其中我们已经做了部分在您点击搜索结果页面的时候,数据已经被采集,包括搜索词和此搜索词下用户点击的链接,可以帮助我们更好的进行网页排序。当然您也可以很容易的添加用户感兴趣的搜索,例如用户搜索完”手表“之后又搜索了”欧米茄“,且这样的用户很多,那么下回在搜索”手表“的时候,您可以把”欧米茄“的广告投放上去,效果应该不错,当然广告投放是很专业的,我当年研究生毕业的时候,论文就是广告投放和推荐,如果有机会,他对于未来的iveely非常重要,不管是移动端和web端。
博客园是个好地方,要是您对内部深入的技术感兴趣,可以在我们的开源主页中的issue中提问,我们会收到您的邮件,会尽量回复您。
1.3 Iveely Search Engine 0.8.0的未来
这两年中历时了7个版本,如果0.7.0是终结版,那么是一件多么可笑的事情,尽管我们遇到了很多困难,很多问题,几乎不可解决,但是在坚持下依然得到了期待的结果,假设现在放弃,怎能对得起未来,所以,0.8.0依然在路上等着我们,而且会越来越好,从0.1.0到0.7.0我们已经看到了这个趋势。0.8.0的任务主要集中在:问答的智能分析推理和图片分析上。为什么是这两项?对不起,我们选择了自己的路,并坚信它是对的,正如题目所说”不一样,那就让他不一样!“。
1.4 关于梦想
一般的时候,我不愿意写这种很”酸“的东西,所以我把这块写在最后,尽可能不要影响本文的核心点,梦想是一个说不清,道不明,但是却让你前行的东西,他的力量超越了欲望,世界在不断的变化,人也在不断的变化,但是总有一件事情没有变化,那就是我们的坚持,坚持是充满痛楚的,所以我们也总在寻找快乐,但最快乐的,莫过于为理想而奋斗!
1.5 捐助我们
我原本是不想写这小节,因为博客园是一个纯净的地方,但是希望大家能够原谅我,如果您愿意,我们非常希望您能够帮助我们,也许在您的帮助下,Iveely 0.8.0 将会是Iveely第一个向外提供服务的版本(我的邮箱:liufanping@iveely.com)。
您的朋友,凡平.