Avatar_small

大规模中英文单词模糊搜索问题的分析(二)

  经过了大约一个星期时间的考虑,也研究了一下各种开源项目的情况。   本来满怀期待地发现了拼写检查器Jazzy的源码研究起来,不过后来发现Jazzy已经两年无人问津了,还是有那么点失望的,不过总的来讲,从拼写检查这个思路上,还是找到了一点新的思路的。   原来使用编辑距离的方法计算单词之间的距离,现在这个核心思想还是没有变,在索引的问题上也有了更多一些的考虑。 ...

Avatar_small

USACO 1.2.2 Transformations題解

Transformations A square pattern of size N x N (1 <= N <= 10) black and white square tiles is transformed into another square pattern. Write a program that will recognize the mini...

Avatar_small

LDA backup

LDA 着实 带领着 Topic model 火了一把。 但是其实我们华人世界内,也不乏好汉,不过呢,都在UIUC,Prof. Zhai的小组里。 他们关于Topic model的大多数工作,都是基于PLSA的变形,然后EM求解。 这里面,他们有两点使用的出神入化,第一点就是先验概率的使用;第二点就是EM的各种变形了,regularized EM。。。 他们组有一...

Avatar_small

使用Xtest模拟鼠标点击

最近做一个小工具,需要模拟鼠标点击事件。当然,我可不想去调用 xdotool 或者 xmacro,效率什么不说,光是添加这么个罕见的依赖就不喜欢。顺便也好练习下 C 编程。 Xtest 的函数名长参数列表也长,不过用起来很简单。我所需要调用的函数就两个: XTestFakeMotionEvent:把鼠标光标移动到指定坐标; XTestFakeButt...

Avatar_small

一段代码的分析

M67的那篇文章在这:http://www.matrix67.com/blog/archives/1598 很久之前就转到自己博客上来了,在这里,当时也没细看,当然也没看明白。 今天仔细分析了下,终于明白怎么回事了。 先用字符串“I love you to death! You are the cutest and sweetest girl I've ...

Avatar_small

Qt 之 Layout

直接贴 Qt 帮助里的原话吧 Tips for Using Layouts When you use a layout, you do not need to pass a parent when constructing the child widgets. The layout will automatically reparent the...

Avatar_small

hud4048

核武的思路:http://hi.baidu.com/aekdycoin/blog/item/69e075f5e200bcf47709d769.html 参考完核武报告,没完全懂~翻了翻组合数学书,这实质上就是求元素可重复的圆排列--许多组合数学书里讲莫比乌斯反演时唯一的例题~ 先求 r 种不同元素,放在圆的n个点上 , 有几种放法, 旋转后相同算一种. 做法是:...

Avatar_small

[job]sougou

刚才做了下搜狗的一道测试题。 一共三次机会,第一次,没仔细看说明,刚看完题目说明,同学喊去吃饭,就去了,结果回来就剩2分钟了,一次机会没了。 题目按我理解不难:一个压缩包.tar.xz, 解压完了,很多文件夹,每个文件夹里有一个图片文件,每个图片里有几个节点,每个节点 包括一个字母,一个数字,中间:隔开。找出以其他所有文件不同的文件,根据里面图片文件内容写答案,...

Avatar_small

硬盘安装fedora14

安装linux系统时需要转备好镜像iso文件和两个目录:isolinux和images,但是fedora 15不需要images,只需要前两个就可以。 开机按F12(不同的电脑会不一样)进入启动设备选择,然后选择你的硬盘进入,进入硬盘系统后,按c进入grub编辑状态,输入以下命令: root(hd0,0)//这一项要根据实际情况选择。 kernel /isoli...

Avatar_small

Mercurial 学习笔记

1Mercurial 一览: 基础 1.1安装 Linux Debian/Ubuntu: apt-get install mercurial Fedora Core: yum install mercurial Gentoo: eme...

Avatar_small

用C语言实现面向对象<03>

前段时间花了三天时间把买了好久《大话设计模式》看了一遍。 我是先看的附录,也就是面向对象基础。 这是一本通俗易通的好书,毋庸置疑。看完之后至少有三个收获: 1.对面向对象语言编程(书中用的是C#)有更深的理解。 面向对象三大特性:封装,继承,多态。 抽象类与接口是什么? 泛型,事件,委托与代理。 真如书中所说,看完比...

Avatar_small

“__stack_chk_fail”错误

今天在做Orange'S第六章时候,对a实验进行make,发生错误: ld -s -Ttext 0x30400 -o kernel.bin kernel/kernel.o kernel/start.o kernel/i8259.o kernel/global.o kernel/protect.o lib/klib.o lib/kliba.o lib/str...

Avatar_small

word2010中将段落按照首字母排序

1、首先全选所有文档。不过要确保你要排序的东西都是以段落为格式的,就是要分段,不在同一行里。 2、全选之后点击插入中的“表格”,选择“文本转换成表格”,这时候你会发现你的东西每一段都分别生成一个表格; 3、接下来单击“布局”中的排序,这个不是中文,是一个图标,一个上面A下面Z左边有一...

Avatar_small

段选择子与描述符的结构及其含义(一)(转)

段描述符:代码段描述符、数据段描述符、系统描述符 系统描述符:系统段描述符、门描述符 系统段描述符:局部描述符表(LDT)的段描述符、任务状态段(TSS)描述符 门描述符:调用门描述符、中断门描述符、陷阱门描述符、任务门描述符。 部分段限长、基地址被存放在2个或3个位置,将由CPU按照值的高...

Avatar_small

php从大文件中读取最后n行

在php中,对于文件的读取时,最快捷的方式莫过于使用一些诸如file、 file_get_contents之类的函数,简简单单的几行代码就能很漂亮 的完成我们所需要的功能。但当所操作的文件是一个比较大的文件时,这些函数可能就显的力不从心, 下面将从一个需求入手来说明对于读取大文件时,常用的操作方法。 需求如下: 现有一个1G左右的日志文件,大约有500多万行, 用php返回最...