3.1 预答辩复盘及后续大论文修改工作

预答辩已经过去一周多了,今天终于没有其他的学习任务,可以好好复盘一下了。这次一共有四名同学,我是最后一个,虽然勉强跟着大家一起过了,但因为一些其他的原因,还是要延毕了。因为大论文写的比较仓促,还是比较烂的,多出来半年的时间可以好好改改,然后好好找工作。

在这个环境里的人都是神仙打架,他们的专业能力都非常强,但这么多年我虽然比较蠢笨但也算是摸索出了自己的生存之道。前三个同学做的东西都很好,但是老师也还是提出了很多问题和建议,很多也是我应该注意和学习的。


第一个同学是 WYK,是做安全的,被问了很久。主要问题如下:

  1. 没有研究问题的整体框架,各个点比较散;
  2. 表格不合规,标题、参数名都没有;
  3. 一年的工作内容。因为是延毕一年,所以会问到一年间额外做了哪些工作,如果是多做的工作,未经过审稿论证的,可以先把工作写上,经过审稿论证的,把结论写上;
  4. 文献罗列不可取。我也是一样的问题,写研究现状就是简单罗列,没有深层次比较分析;
  5. 整体做得比较浅。老师们大多都是安全出身,所以看问题还是一眼中的,其实我也是存在同样的问题。

高老师对该同学的问题进行了总结:

  1. 要保证大论文的篇幅。但是该同学把不相关的内容加上去了,反而是减分项。应该把不相关的删掉,减少重复。
  2. 关于如何增加论文篇幅,为什么会没得写,高老师给出的建议感觉还挺有用的:把工作做细,就有的写。实验条件、环境,所得结果的最大值、最小值、平均值等。
  3. 有不规范的表述,表述比较口语。我觉着我也是一样的问题。

中间我导师也提了很多,重点是增加论文的篇幅、干货。最后立武老师也提了几点,和前面几条有重复的:

  1. 要明确目标,该补的章节补上;
  2. 写专业内容相关的东西,无关的删掉;
  3. 大面上大家都知道的东西,删掉,这些说不说无差别;
  4. 用词、语句不严谨,如 CIA 的定义,基本概念不能挑战、改写。

第二个是郭老师,郭老师做的工作比较多,呈现得也非常好,老师们说论文写的很规整,基本没有提太多问题。
只有立武老师提了几个小的注意事项:

  1. 摘要不要出现文献引用;
  2. 对于知识的定义。这个老师每次都会提到这个问题,并给出了建议:浙大、陈华钧《知识图谱导论》里面应该有,还提到 DIPW……,认知、感知、推理等。
  3. 对于 AI 核心问题的探讨。老师提了一个问题,问 AI 的核心问题是什么?我当时想的答案是“意识计算”,老师给出的答案是 “知识表示和利用”,但是 却并不看好 KGE 的发展,我觉得非常赞同。

第三个是 HSK 师兄,做的是推理问答系统,比较偏应用。师兄有 5 篇论文,工作量也是非常充实了。老师们主要提出的问题如下:

因为师兄是最后才讲框架,姚老师指出研究框架应该放在前面来讲。而且我看到很多师兄师姐会把研究框架单独成为一章,用于强调自己各项研究内容之间的关系,但是我导指出框架最好是合到某一章节之中自成一章略显单薄。

翟老师提出了非常犀利的问题:文本知识的问答系统,很多人都在做,你的创新性在哪里?复杂推理也有人做,效果如何,与别人的不同?比别人(别的机构)强在哪里,研究的到底是不是一个科学问题。Anyway 都是很根本性的问题。这里想到我的缺陷,就是对于现在做到什么程度,讲的也不是很清楚;对于研究的问题,也应当确定是旧问题还是新问题,如果是新问题,最好有一个明确的定义。

立武老师提出的问题:图中文字太小、图的质量不好。又提到了知识的概念,数据库与知识库的异同:数据库不需要多次交互,而问答系统比检索系统需要多次与人的交互。这里提到一个新词:知识系统,指的是可以和人没有交互的系统,将文本视为黑盒。知识如果定义清楚了,可能不需要歧义处理了。这位老师说自然语言结构化是可以做的东西。我觉得很有启发,这方面的工作或许是比较实用的。

一个心得:博士的研究不在多、而在精、细。当然工作量的体现也是一部分,但更重要的就是把一个问题做到极致的工作,关于对问题的分析、解决方法、详细的实验分析、为什么好的解释等。要把呈现出来的东西都搞清楚,才能无懈可击。就是丁是丁卯是卯。


最后一个就是我了,我做的东西跟前几位同学比起来立刻就是高下立见,但是老师们都非常 nice,都从帮我搞得更好能顺利毕业的角度提出一些建议,没有任何严厉的批评,我想老师们可能是出于同情吧orz。都是很有用的建议:

  1. Conv3D 效果很好,但没有给出合适的解释原因。这一点是一直就存在的问题,是每次都会被提到的缺陷,得需要找一个强有力的理由来说服自己和评阅人。高老师和逸飞师兄帮忙从视觉领域多通道推测了一下原因,嵌入向量堆到一起,可以抓住主成分,多通道类似并行多分量。后面看看图像领域的场景找找说法。可能还要具体说下参数的优势,做一些更有说服力的实验什么的。不能总是呈现一个好的结果,然后泛泛地说模型架构的优势。

  2. 翻译特性应该具体解释一下,\(h+r \approx t\);同理,语义模糊也应该有个明确的解释。

  3. 第二章研究现状纯粹就是文献堆砌,不可取。应当突出与后面工作的联系:从语义、关系角度介绍研究现状:从卷积的语义空间呈现研究现状。

  4. 数据集那章需要有一个可以推广到其他领域的普适性方法。先说输入、讲方法的通用性,再说效果。要能延伸到其他领域,这个也得考虑下怎么整。(高老师对翟老师所提问题的解围和建议)

最后翟老师问了一个问题差点没答出来,说我最后的数据集构建怎么应用到其他领域,有什么用,让我说物流领域怎么用,可是物流领域我真的不懂,勉强招架了几句,最后提到了国网的主设备知识库,总算是圆过去了。

其他同学存在的问题我也应当改正的:

  1. 整体框架,几个研究点成体系;
  2. 增加篇幅,实验描述更详细,要增加干货;
  3. 表述口语化问题。

自己想到的自己问题:

  1. 研究内容一中,我对于实体和关系的多义问题,没有给出准确详细的解释说明;
  2. KG2GM 的应用场景:存在多义现象的场景;(表明自己做的东西的实际应用价值很重要)
  3. Conv3D 的优势:在维度低的情况下比其他模型好;
  4. 现在做到什么程度没有清晰描述,提出新问题要有定义。
    (我的几个研究内容都比较粗糙,可能需要再搞细一些;可能不需要加太多新的东西了,把现在这几个呈现清楚就好了)
  5. 检查图片呈现效果。

虽然也给答辩时候的自己录了音,但还是没有勇气打开听。这次答辩又是没有提前练习预讲,总还是感觉自己做的东西很鸡肋。后面时间比较宽裕,就应该准备得更充分一些。虽然多了半年,但要消化过去半年进展过快带来的历史遗留问题,还要找工作,也不会太清闲。1月是个比较尴尬的时间点,但也就这么定了吧,在自己的世界,解决自己遇到的问题。后面的工作就是把之前攒的学习资料整理一下,然后根据上面列的问题改论文。

posted @ 2022-03-10 11:18  胡萝不青菜  阅读(1040)  评论(12编辑  收藏  举报