大规模中英文单词模糊搜索问题的分析(二)
经过了大约一个星期时间的考虑,也研究了一下各种开源项目的情况。
本来满怀期待地发现了拼写检查器Jazzy的源码研究起来,不过后来发现Jazzy已经两年无人问津了,还是有那么点失望的,不过总的来讲,从拼写检查这个思路上,还是找到了一点新的思路的。
原来使用编辑距离的方法计算单词之间的距离,现在这个核心思想还是没有变,在索引的问题上也有了更多一些的考虑。
...
USACO 1.2.2 Transformations題解
Transformations
A square pattern of size N x N (1 <= N <= 10) black and white square tiles is transformed into another square pattern. Write a program that will recognize the mini...
LDA backup
LDA 着实 带领着 Topic model 火了一把。
但是其实我们华人世界内,也不乏好汉,不过呢,都在UIUC,Prof. Zhai的小组里。
他们关于Topic model的大多数工作,都是基于PLSA的变形,然后EM求解。
这里面,他们有两点使用的出神入化,第一点就是先验概率的使用;第二点就是EM的各种变形了,regularized EM。。。
他们组有一...
使用Xtest模拟鼠标点击
最近做一个小工具,需要模拟鼠标点击事件。当然,我可不想去调用 xdotool 或者 xmacro,效率什么不说,光是添加这么个罕见的依赖就不喜欢。顺便也好练习下 C 编程。
Xtest 的函数名长参数列表也长,不过用起来很简单。我所需要调用的函数就两个:
XTestFakeMotionEvent:把鼠标光标移动到指定坐标;
XTestFakeButt...
一段代码的分析
M67的那篇文章在这:http://www.matrix67.com/blog/archives/1598
很久之前就转到自己博客上来了,在这里,当时也没细看,当然也没看明白。
今天仔细分析了下,终于明白怎么回事了。
先用字符串“I love you to death! You are the cutest and sweetest girl I've ...
Qt 之 Layout
直接贴 Qt 帮助里的原话吧
Tips for Using Layouts
When you use a layout, you do not need to pass a parent when constructing the child widgets. The layout will automatically reparent the...
hud4048
核武的思路:http://hi.baidu.com/aekdycoin/blog/item/69e075f5e200bcf47709d769.html
参考完核武报告,没完全懂~翻了翻组合数学书,这实质上就是求元素可重复的圆排列--许多组合数学书里讲莫比乌斯反演时唯一的例题~
先求 r 种不同元素,放在圆的n个点上 , 有几种放法, 旋转后相同算一种.
做法是:...
[job]sougou
刚才做了下搜狗的一道测试题。
一共三次机会,第一次,没仔细看说明,刚看完题目说明,同学喊去吃饭,就去了,结果回来就剩2分钟了,一次机会没了。
题目按我理解不难:一个压缩包.tar.xz, 解压完了,很多文件夹,每个文件夹里有一个图片文件,每个图片里有几个节点,每个节点
包括一个字母,一个数字,中间:隔开。找出以其他所有文件不同的文件,根据里面图片文件内容写答案,...
硬盘安装fedora14
安装linux系统时需要转备好镜像iso文件和两个目录:isolinux和images,但是fedora 15不需要images,只需要前两个就可以。
开机按F12(不同的电脑会不一样)进入启动设备选择,然后选择你的硬盘进入,进入硬盘系统后,按c进入grub编辑状态,输入以下命令:
root(hd0,0)//这一项要根据实际情况选择。
kernel /isoli...
Mercurial 学习笔记
1Mercurial 一览: 基础
1.1安装
Linux
Debian/Ubuntu:
apt-get install mercurial
Fedora Core:
yum install mercurial
Gentoo:
eme...
用C语言实现面向对象<03>
前段时间花了三天时间把买了好久《大话设计模式》看了一遍。
我是先看的附录,也就是面向对象基础。
这是一本通俗易通的好书,毋庸置疑。看完之后至少有三个收获:
1.对面向对象语言编程(书中用的是C#)有更深的理解。
面向对象三大特性:封装,继承,多态。
抽象类与接口是什么?
泛型,事件,委托与代理。
真如书中所说,看完比...
“__stack_chk_fail”错误
今天在做Orange'S第六章时候,对a实验进行make,发生错误:
ld -s -Ttext 0x30400 -o kernel.bin kernel/kernel.o kernel/start.o kernel/i8259.o kernel/global.o kernel/protect.o lib/klib.o lib/kliba.o lib/str...
word2010中将段落按照首字母排序
1、首先全选所有文档。不过要确保你要排序的东西都是以段落为格式的,就是要分段,不在同一行里。
2、全选之后点击插入中的“表格”,选择“文本转换成表格”,这时候你会发现你的东西每一段都分别生成一个表格;
3、接下来单击“布局”中的排序,这个不是中文,是一个图标,一个上面A下面Z左边有一...
段选择子与描述符的结构及其含义(一)(转)
段描述符:代码段描述符、数据段描述符、系统描述符
系统描述符:系统段描述符、门描述符
系统段描述符:局部描述符表(LDT)的段描述符、任务状态段(TSS)描述符
门描述符:调用门描述符、中断门描述符、陷阱门描述符、任务门描述符。
部分段限长、基地址被存放在2个或3个位置,将由CPU按照值的高...
php从大文件中读取最后n行
在php中,对于文件的读取时,最快捷的方式莫过于使用一些诸如file、 file_get_contents之类的函数,简简单单的几行代码就能很漂亮 的完成我们所需要的功能。但当所操作的文件是一个比较大的文件时,这些函数可能就显的力不从心, 下面将从一个需求入手来说明对于读取大文件时,常用的操作方法。
需求如下: 现有一个1G左右的日志文件,大约有500多万行, 用php返回最...