今天办公室同事求助。这几天领导要他查找大量历史文件。 该单位以及上级的大部分材料和文件都是用EMAIL邮件收发文的。而且,经常是PDFRARwordexcelWPSJPG各种格式的掺杂在一起。 文件名也没有规律。有的叫新建文档,有的用文号命名,有的用文件标题命名。 这可难倒他了! 收文他只收过最近几个月的,这几个月的文件他大不了用电脑自带的搜索功能慢慢搜索。可是领导要的文件有的是几年前的。这些文件很多都归档放起来了,如果去一大堆的纸质材料里头去找这些材料,犹如大海捞针! 于是他找到我帮忙,看看有没有什么捷径方法,能够快速搞定。方案1,利用邮箱自带的搜索功能。 现在常用的邮箱什么QQ,163等等邮箱,在网页端都有搜索功能。直接在邮件搜索里头输入要找的文件标题的几个核心关键字。比如要找《关于印发《计算机技术与软件专业技术资格(水平)考试暂行规定》和《计算机技术与软件专业技术资格(水平)考试实施办法》的通知》(它的文号是〔国人部发〔2003〕39号〕),这篇文章,直接搜索【软件专业技术资格】,或者【国人部发】 用这个方案,找到了30的文件。 优点,查找速度快。 缺点,找到的概率低。 方案2,将所有的附件下载下来 邮件的量少,手工一个一个下载,倒是可以。 我朋友这个邮箱有5000多份邮件,不可能手动下载,所以写了一个程序。下载了1天,总共5G多的附件。 下载完成后,将里头的rarzip等压缩包搜索出来,然后解压出来。然后利用Windows自带的搜索功能搜索。 比如要找《关于印发《计算机技术与软件专业技术资格(水平)考试暂行规定》和《计算机技术与软件专业技术资格(水平)考试实施办法》的通知》(它的文号是〔国人部发〔2003〕39号〕)这篇文章,直接搜索【软件专业技术资格】,或者【国人部发】。 不过发现Windows自带的搜索功能速度非常慢,搜索一次要10多分钟到半小时。 所以又找了个搜索工具提高搜索速度。 这次,效率和准确率就高了很多。 直接搜索【软件专业技术资格】,或者【国人部发】。10秒就能搜索出结果。 好在当初的那些文件里头大部分标题都是按文号或者标题命名。 所以最后和同事两个人一起,找到了大概90的文件。 剩余的10可能不是用邮件发过来的,或者命名是乱的而且是一个PDF或者图片,这种确实没办法找到。他只能默默的到档案室里头慢慢的一本一本找了。 不过总体来说,帮他节省了不少时间。他还是很开心的。 效果如下 优点,查找速度快,覆盖面较为全面。 缺点,第一次下载所有邮件非常耗时(下载了1天),如果内容是PDF或者图片,而且文件名是乱起的,确实搜索不到。 如果你有更好的方法,欢迎指导。 如果留言的人多的话,也许我会考虑后续做成软件。