前言
终于投了一篇会议的论文,期待有好的消息。写论文是段痛苦的经历,当然是针对我这样既不是天才也不是写论文大牛而言的。我不过是个新手而矣。写论文的过程中有不少体会和感受,有沾沾自喜的,也有遗憾不已的。写下来留作备忘。
1.选题篇
毫无疑问,选题对于写论文是“相当”重要。不是有句俗话么,“男怕挑错行,女怕嫁错郎”。做学生的,写论文最怕选错题。
说到选题,允许我先跑个题,说说为什么写论文这个话题。那位有点不乐意了,“你丫一个空口白牙、乳臭未干的小硕,凭嘛在这胡说八道一番。”呵呵,这位大哥,我不是说了么,这是俺的备忘录,就说说我自己的看法么。虽然我没写过啥像样的论文,但没吃过肘子还没看过猪跑么。一些经验教训先留在这里,以防日后再犯。
好言归正传,我想说说个人对写论文的看法。为什么写论文?从理想主义出发,可以说是为了科学研究添砖加瓦——哪怕是块废瓦。科学大海不择细流么,不是?从食用主义出发,写论文好处多多。说得功利一点,博士研究生毕业要论文,教师评教授要论文,教授评博导更离不开论文,博导著书立说少了论文哪成?。除此之外,投中一些会议的文章,也能有不错的旅游机会。还有,出国留学,如果有几篇论文相助,无疑会增加敲门砖的重量(我也使道听途说)。
个人觉得,一方面,搞研究终究是比较严肃的事情,需要兴趣、热情和执着。真正成功的大牛们,多数是兴趣使之然,没准或多或少是个完美主义者。Knuth苦心十年铸成TeX,除了写书,估计没赚什么钱。如果不是兴趣,如果没有“完美主义”的诱惑,估计今天也没有了TeX这个大家族了。另一方面来说,如果在做研究上添上点功利,未必是个坏事。申请资金多实际啊,不贴近实际谁给钱那?据说911以后,美国各大高校的研究机构,右边没边地都往“反恐”上靠。不知道有没有人申请“基于全球分布式网络的反恐信息检索和抽取的研究”。这个很实际啊,不靠就没钱,没钱就没研究了,要不然中个会议论文都没法买机票去旅游。做研究,实际问题是基础,但又不能不纯粹一些。研究员整天考虑CEO的事情,恐怕很难做好研究吧。
回过头来继续说为啥写论文。理由千千万,不如朴实一点好:解决问题后的解题报告。解决了一个前人没有解决的问题,论文可以帮助你向世界公布你的成果,并且分享喜悦。把眼光放长远一点,解决问题才是硬道理。问题解决了,论文自然就出来了。很多大牛,之所以牛,不是因为他们论文写得多,而是因为他们解决的问题多。论文多对他们来说,不过是个副产品罢了。
读那些高水论文,不是因为词藻华丽,也不因为数学公式天花乱坠一般。真正好的论文,朴实无华,每个细节都交代清楚。读这样的论文,仿佛能够与作者跨越时空地交流,仿佛能够体会到他或她解决问题的快乐。相比之下,国内不少期刊的论文,缺乏这种朴实,被太多的“金玉”包裹着。
说这些话的时候,我也惭愧,写了的文章,基本还是垃圾文章,没有从长远目标出发。在这里“空口白牙”的乱讲一通,有点大言不惭。反正,我希望我能明白这些问题,在以后写论文的过程中,不断地向理想目标修正。
关于论文的选题,我看了几篇文章,其中邹承鲁院士的文章《科学研究五十年的点滴体会》强烈推荐。真的是非常非常棒。这是五十年研究与人生的精华。百读不厌。其中讲到“构思与选题”,总结了基础研究的三个来源,归纳了选题的三个原则。虽然我是学工科的,和基础科学有些不同,但这些指导原则应当结合到实际中,具体问题具体分析——马克思主义的精髓么。另外我们实验室(http://ir.hit.edu.cn)上面的刘挺教授的《关于研究》,也值得多读。我都打印下来了,经常看看。
接着说说我的教训吧,选题方面的。我是那种比较喜欢做白日梦的人,经常有一些点子,虽称不上奇思妙想,但也能有点创新吧。不过这些点子,多数脱离我的实际研究能力 :-(。从本科到研究生,在实验室混了快五年了,参与过几个项目,有选的合适的,多半是不合适的。下面自我剖析,案例教学:-)。
本科时,Tim建议我选题目“单文档自动文摘”。当时初进实验室,热血沸腾,拿起一些论文就看。结果看了几个月,丝毫没有头绪,没有任何进展。估计当时颇令Tim失望。当时我本身也有局限性,比如不懂啥叫研究、不知道何为NLP(自然语言处理),而且一些基础知识也不到位等等,比如统计理论、模式识别、机器学习等。做题时还犯了几个错误:
(1)不是不查文献,而是仅仅陷在一篇文献里面。当时把一篇综述性质的文章当作经书来读,结果...。不得不说,任何一篇都有局限性,甚至作者在写论文的时候,不可避免受到个人主观、客观的限制,论文中难免有一些务虚甚至是错误的东西。比如,写论文的时候,如果结果不够好,作者一般不愿意直接在论文中表述,或者表述模糊一点,这样读论文的人很容易误解、曲解。后来上“自然语言处理”课的时候,Guan老师提了一句秘诀:“取法其中得其上”。意思就是读文章要多读,从多篇相关的文章中分析出确定的规律和结论。之后我就一直记得这句话。用来指导选题,应该是“相当”有用吧:-)。
(2) 第二个错误就是,不加分析和规划,直接动手。做实验学知识是件好事,但是最好建立在有准备的基础上。我当时连什么是分词、词性标注都不知道,上来就像计算两篇文章的词项关系矩阵。当时我掌握基本的C++编程,很单纯地认为矩阵计算可以很容易实现,花了很长时间去准备矩阵计算的程序,后来才知道很多数值运算可以用Matlab等工具计算...。
(3) 没有分清是研究性课题还是开发性课题。显然二者有很大的区别。Tim经常强调,研究性课题注重创新,开发性课题注重效果。对于研究性的课题来说,了解最新方法是为了探索更新的方法,发掘创新点。而开发课题,关键是要如何迅速地实现一种已有的方法,并且有不错的效果。可惜我当时没有弄清题目的性质,其实就是审错题,以为让我去研究“单文档自动文摘”呢。
个人经验总结一下,选题至关重要,分清是研究性的还是开发性的。选题之前一定要充分了解课题,多读一些相关文献,最好再和有经验的教授、师兄师姐、学长等充分地聊聊。走路选好方向就是到达目的地的保证;研究选好的题目才使成功的变得可能。
先写到这里。