机器学习也感性
张睿卿大一时開始參加ACM。后来成为学校ACM集训队中硕果仅存的妹纸,大二时和学长合办了Can Studio工作室,领导5位骨干成员,完毕校内各院系办学软件与管理站点开发,完毕宁波市公安局外包任务等。眼下在浙江大学读研,參与了机器学习、人脸识别等相关的各种高大上项目。
她在CSDN的博客涉及ACM、机器学习、数据挖掘、编程语言等各个方面,被非常多人转载,也帮助过非常多同道中人解决这个问题。
优秀、理性是张睿卿给笔者的第一印象。採訪时听到张睿卿的声音,才体会到她感性的那一面——爽朗、直率、声音甜美。下面让我们通过採訪实录走近这位90后美女程序媛:
突觉编程好好玩,遂始编……
CSDN:什么时候開始编程?
张睿卿:我接触编程比較晚,是08年上了大学才開始的。大学进来是project技术类(但不是计算机系)。可是还没有明白的方向。
当我開始坐在电脑前写程序的时候,我才找到了自己的方向,这是一件让我能够心无旁骛的事情,就这样開始了我的程序猿之路。
CSDN:你提到參加ACM校队时最后常常训练的仅仅剩下你一个女生,她们为什么没有坚持下来?你有没有遇到什么困难?是怎样克服的?
张睿卿:大多数人看来。编程是枯燥的。所以训练的时候看着题目发呆,然后走神,然后就随心飞翔了。我不专指女生,也不认为这是我们女孩子自己的问题。
IT誉为男孩子的天下,所以女孩子们不敢触及。事实上大家都一样,定位不同而已。想要什么样的自己,就能够打造什么样的自己,所以我认为仅仅要你喜欢敲代码,就去做好啦。
我们这届ACM校队终于仅仅留下我一个女生在训练可能有多米诺骨牌效应。仅仅要有一个女生累了倦了,其它女生也会退却。并且最关键的是,当初不是你由于喜欢而去做这件事情。
困难肯定会遇到。不论是之前刷题。还是之后拿一些项目,或者如今的科研。无一例外会遇到瓶颈期:难度到了一定阶段做不下去了想转别的做做,或者没出成果心情不舒畅了想窝在寝室呆一周。这些是正常现象。我认为不须要刻意克服吧。寂寞了自己就会回来继续干了,还是那句话。仅仅要你喜欢,就不会轻易放弃。
关于生活:爱爬山,爱跑步,单身(你懂的)
CSDN:在关注技术外,生活中有哪些兴趣?
张睿卿:我喜欢爬山,喜欢跑步。
由于浙大后面就有座老和山。爬起来也非常方便。曾经跑过13km的短程杭州马拉松。是个非常考验耐力的过程。和编程一样,当你认为自己要完蛋的时候。和自己说我能行就能够坚持下来。
CSDN:你有没有认为编程会对自己的生活和思维方式有什么影响?比方女生更感性一点,可是编程更须要理性思维。
张睿卿:事实上我认为没差多少。我还是我。或者可能受了影响我不知道,大学開始编程,工作上比較认真,并且常常担任类似leader的工作,可是或许是认真适合静下来编程。而不是编程影响了我的认真。
逻辑方面肯定有提升。思维须要训练,ACM给我非常大帮助。生活方面没有改变吧。生活是生活,程序是程序。
程序活在我的生命里。但我的生命里还有更重要的,比方朋友。老师。
CSDN:想对广大的女程序猿同胞们说些什么?
张睿卿:开心敲代码,快乐过生活。
不要由于程序有bug而痛苦。至少你们相爱过。
CSDN:程序猿是个常常熬夜的职业,有没有护肤秘诀?
张睿卿:这个,我在用郁美净/孩儿面/强生。感觉还不错……
CSDN:有没有男朋友?
张睿卿:囧,还没有……
研究生毕业后会工作(求BAT等HR勾搭)
CSDN:简要介绍下大学时的工作室,对你产生了什么特别的影响?
张睿卿:Can Studio是毕业的学长汪晓丹为了回馈母校找到我们组织的一个工作室,后来团队成长起来由5个backbone组成,承担校内外一些外包项目,5个人从投标到交付任务非常紧凑。团队非常小,项目不大,注定了我们的敏捷开发模式。对我个人而言。从一个人写代码到一个团队coding,学习了非常多东西。改掉了非常多编码恶习。而从整个团队来讲,这次cooperate是一个难得的在校创业经历。体验了非常多编程之外的难题。
CSDN:计划继续读博还是工作呢?有没有创业的打算啊?
张睿卿:想工作吧,只是临时还没有创业的打算。自己还比較弱,得在大公司锻炼下再作打算啦!
关于高大上的技术
CSDN:你从10年開始在CSDN写博客坚持到如今,你认为对你的学习和生活有什么帮助?
张睿卿:在10年的时候。我写的不是博客。是寂寞……仅仅是流水账一样每天记录下自己遇到的ACM难题,projectbug。easy出现的问题etc。后来有人留言从中受益。节省了别人非常多时间。我就认为这个博客要一直写下去。一方面方便他人,也方便自己查阅。就像我在《2013年度总结》中说的。有些东西记录下来不一定能帮到多少人。但仅仅要大家还有共同交流idea的愿望就有写下去的意义。
CSDN:你的博客中对非常多方向都有涉猎,是兴趣还是其它原因?计算机视觉,机器学习,算法研究。博弈,人工智能...怎样看待这些方向之间的联系?
张睿卿:是的,由于有兴趣看这些方面的知识。他们的联系非常紧密,关系比較微妙。计算机视觉是应用,机器学习和算法研究是基础。
而计算机视觉又是为人工智能服务的。
我觉得机器学习分两路:神经网络和字典学习。前者比方deep learning用神经网络模拟人的神经元进行“思考”,后者我也在blog里总结过一些字典学习的算法(如KSVD),也能够用于图像特征提取,我觉得如果字典设计的够好,两种方法的结果是一样的。
博弈呢,属于算法研究的一部分。我个人比較喜欢看一些博弈问题,比方海盗分金币,尽管在博弈中的如果一般不成立(没有人纯理性不受干扰地做选择),可是我们享受的仅仅是博弈思考的过程。
CSDN:你本人最擅长的技术是什么?
张睿卿:计算机视觉,数据挖掘,以及对生活中的问题建模。
CSDN:对于想要学习机器学习和算法的学生,你有什么建议?应该重点学好哪些课程?
对于机器学习的同学,多看书,多看paper。
新手不要急着发paper,看牛paper,无论多老,都要啃牢那些经典的知识。
书籍。建议看《Pattern Recognition》、 《Pattern recognition and machine learning》、《Machine Learning - A Probabilistic Perspective》任选一本,切勿挑来挑去。手头工具书:《matrix cookbook》。对于做研究的同学,挑一个自己喜欢的方向去钻研paper总会有idea。相同。切勿跳来跳去。
对于做project的同学:调研好一个方法对于什么样的数据有效后再下手,切勿有source code就拿来用,这样会浪费非常多时间。重点学好数据结构,算法两门课。
CSDN:你觉得眼下国内在机器学习和算法研究方面的实践水平怎样?哪些学校/企业/科研机构在这些方面有发言权?
张睿卿:近几年国内在机器学习领域已经有所进展,尽管不得不说我们大多数时候还是在follow别人的工作……囧,可是仅仅要跟得快。vision把握得准,中国在科研领域的实力是会稳步上升的。
我没有去大公司实习,所以也不好说企业实力,但就我所知,中科院计算所。自己主动化所在计算机视觉方面还是不错的,清华张长水老师、朱军老师和南大有周志华理论非常扎实。
还有我们浙大也还好啦。嘿嘿~
大牛Google在AI上研究势头非常猛,包含智能车,Google Glass,各种机器人都非常前沿。近期它又收购了游戏天才和神经科学专家创办的公司DeepMind。恩……Google还会继续。
MSRA是工业界的研究院,为中国高等人才培养立下汗马功劳;百度余凯的deep learning组近几年在图像大数据处理方面非常不错。也有不少产品上线。阿里和腾讯,数据非常多。人才也不少,可是貌似没有往研究方向走。他们比較注重应用。
好吧。 期待睿卿能奉献很多其它佳作。