Wednesday, November 26, 2008

自然语言处理相关资料推荐

首行用来豆瓣识别Blog所有权,识别码:doubanclaima6d72baa8d2ffea3。

书:

http://product.dangdang.com/product.aspx?product_id=20222982

统计自然语言处理  宗成庆

作为一本综合的自然语言处理,特别是中文处理的入门教材,本书是一本不可多的的材料。里面引述了到06年前,有关NLP的诸多进展,可以作为一本处理方法的速查手册。哪怕仅仅是作为一份论文的index,本书也物有所值。

博客:
 
http://www.googlechinablog.com/2006/04/blog-post.html

数学之美系列 Google黑板报

Google 科学家吴军写的《数学之美》系列文章,介绍数学在信息检索和自然语言处理中的主导作用和奇妙应用。

http://www.wespoke.com/

搜索引擎研究

Tags: 自然语言


Tuesday, November 11, 2008

Google app engine使用代理上传文件方法

不实用代理的正常情况下,使用下列命令上传完成的应用程序到Google App Engine:

appcfg.py update helloworld/

上传时会要求输入用户名和密码通过网络验证,验证时候使用https。由于Python内置库urllib2使用代理访问https存在Bug,所以使用普通的https代理无法进行上传。

对此,延缓的脚步的通过代理更新appengine 一文中使用pytunnel给出一个解决方案。

其实还有另外的办法:

  1. WIN32下使用sockscap+tor,或者更加简单的直接使用火凤凰。
  2. Linux下使用tsocks+tor。
这两种方法都是采用的socks代理。

Tags: google