Avatar_small

Java 读取 doc docx pdf rtf txt html 文件文本内容

最近需要解析用户上传文档的文本内容,自己没有搜到很好的资料,在http://scturtle.is-programmer.com/的介绍下,找到了一些参考资料,于是很快的完成了基本文件格式的解析。下面把资料的链接跟代码地址附上 1.MS doc/docx/Excel/Powerpoint/... 解析微软的office文件有Apache的POI类库支持,只是doc/do...

Avatar_small

随机数种子的选择

  随机数生成器的质量七绝于其产生的序列是否在任意输入下拟合均匀分布,相对而言,选择一个优秀的随机数生成器不是件特别困难的事情,然而选择优质的随机数种子却有许多需要注意的地方。在只需要产生拟合均匀分布的随机序列时,选取随机数种子没有特别的要求。然而随机数生成器往往会被用于产生密钥的哈希算法,此时对于种子的选取就有特定的要求。   有一些反面教材可供参考: 1995年9月...

Avatar_small

LU-decomposition -- LU-分解法

LU分解法: 最好的功能是在于它在解A*x = b,并且当有许多个A相同,b不同的式子时,效率较高。 算法思想(由VC++那本书上说,这个又叫杜利特尔Doolittle方法): 我们将A分解成为两个子矩阵L和U,令A = L * U。其中L是下三角矩阵,U是上三角矩阵。

Avatar_small

Python将工作分布到多个线程

使用threading #!/usr/bin/env python3 import optparse import os import queue import threading BLOCK_SIZE = 8000 class Worker(threading.Thread): def __init__(self, wor...

Avatar_small

关于偏序集与dilworth。【拦截导弹题解】

看了好久好久,终于看懂了。 于是果断发一篇。 尽量讲得易懂点吧。 【第一篇学术讨论文~~】 首先,二元关系的定义: 设S是一个非空集合,若R是关于S的有序元素对的一个关系,即对S中任意一个有序元素对(a,b),我们总能确定a与b是否满足条件R,就称R是S的一个关系(relation),又由于他是建立在二元(即S中任意两个元素)之上的,...

Avatar_small

Gauss-Jordan 高斯约当消去法

我听取了我们老师的想法,把原书中的命名改为以意义为中心的,不简化的命名方式。原本函数名为gaussj,现在改为gaussJordan Gauss-Jordan消去法解的是这个线性方程组集合:(我完全不会LaTex呢,而且鉴于复制贴贴的方便,或者转载分享之后会出现不能显示的问题,我会尽量少用Latex公式的) [tex]A*(X_0 \cup X_1 \cup X_2 \...

Avatar_small

CSS样式库

What? 一般由专业前端设计人员编写的可复用CSS样式,涵盖常用的布局、元素、组件配置。 Why? DRY & DRW。流行的样式库能保证不同浏览器之间的兼容性,复用性高,有人维护(升级空间)。如果不是做专业项目,使用CSS样式库可以大幅减少相关代码的书写,可以使更多的时间花在核心业务上。 Where? 99Lime: http://w...

Avatar_small

nr3.h的实现

nr3.h可能会在以后被改动,如果改动了,就会在本文中添加或者修改。 在书中它是用nr3.h这个头文件的,名字便不再去改了。它是用类和泛型实现Vector和Matrix的,根据书上提供的几个接口,大致实现了一下这个东西。

Avatar_small

calendar.h -- 引起兴趣?儒略日?这是什么?

《Numerical Recipes》给的第一个程序是计算月相、儒略日和普通日之间的互相转换这样的。但貌似以前都居然不知道有儒略日这个东西,这样太伤我心了。查一下:

Avatar_small

Numerical Receipes 数值代数分类序言

鄙人上学期上了或者说旁听了数值代数Matlab的课程,所以一不小心就觉得应该稍微弄出点什么来了,于是想应该用C++实现一下那些数值代数的东东。但想到自己悲剧的数学,于是想想还是多看几本参考书,然后复制拷贝整理一下,码码字,作为自己的慰藉罢了。所以很可能会在接下来的一小段时间内,写一点有关数值代数的东西。如果用到什么参考书,或者参考什么链接,会在本文中感谢的(这样的话,就不在后文中一一感...

Avatar_small

内核模块编译

Makefile文件 # 内核文件名称 obj-m := hello.o # 内核源码地址 KDIR := /lib/modules/$(shell uname -r)/build # 当前路径 PWD = $(shell pwd) default: make -C $(KDIR) SUBDIRS=$(PWD) modules clean...

Avatar_small

常用软件绘制高质量 (DPI) 图片 (Matlab,VISIO,POWERPOINT,MsWORD,MsEXCEL)for printed paper

摘要: 本文主要介绍常见绘图工具(Matlab,VISIO,POWERPOINT,MsWORD,MsEXCEL)获取高质量图片的方法。同时,笔者根据以往经验,对不同图片格式对图片打印效果进行简要的说明。 范围: 本文所指的高质量图片,指的是300-600 dpi的图片。Picture with Higher Resolution 不在考虑之列。 DPI:...

Avatar_small

为 Chito 修改 Markdown

我使用 Markdown 写博客已经有段时间了,但是一直以来有个小小的问题:对于代码块,markdown 生成的是一个<pre>标签里套一个<code>标签。缩进四个空格还好,用 Vim 的列编辑就行了(>操作不行,因为空行不会被缩进),可是删除这些<code>标签并加上相应的语言标识很烦。于是有了以下 Python 代码,使用的是 Pytho...

Avatar_small

有字有謀

從小蝦同學那裏轉來的,稍有修改,此當爲互動娛樂之良品也。

Avatar_small

Python将工作分布到多个进程

下面示例实现是在目录或者递归目录下查找文件中是否存在提供的字符串,返回该文件名。此示例是通过subprocess模块实现的多进程执行。 grepword-p.py #!/usr/bin/env python3 import optparse import os import subprocess import sys def main(): chil...