最近在使用EM算法处理mixtures相关问题,遇到了一个已知component密度分布函数,求其权重的问题。在一篇paper中,作者很简洁地给出了相关方法,但是没有详细的算法描述。之所以没有花费笔墨描述该算法,源于此算法比较简单,不便赘述。为了找到此算法的具体描述,浪费了很多时间,皆因问题定位不清,精确搜索资料的效率低下。为提高今后查阅资料的效率,减少解决问题的时间,在此记下。
首先,是思路问题。对于一个紧迫而所需知识点颇多的问题,正确的做法是应该尽快正确的解决,而不是埋头从最基础的问题研究起。虽然研究最基础的问题,能够帮助彻底理解问题,但是时间成本较大,不适合紧迫的任务。
然后,精确定位问题。正确的描述问题是很需要功夫的一个问题。描述问题的粒度可粗可细,过粗则找到的都是基础知识和思路,过细则很有可能找不到问题的答案。推荐的方法是使用粗的概念+细的实例来进行定位问题。这样做的好处是兼顾了粗和细的粒度,找到问题答案的可能性比较高。
第三,找到资料后,首先要浏览全文,从整体的高度判断该资料的价值。然后锁定与问题相关度最高的段落或章节,细致阅读。
最后,关于资料源的问题。个人感觉,总体来说英文技术资料比中文技术资料更多更细致,推荐使用英文搜索。英文搜索固然需要一定的英文基础,但是回报率很高,很容易找到浅显易懂的答案。