搜狗校招笔试题

时间:2022-11-22 02:55:11 面试笔试 我要投稿
  • 相关推荐

搜狗2015校招笔试题

  ①、机器学习

搜狗2015校招笔试题

  下列哪个不属于CRF模型对于HMM和MEMM模型的优势( )

  A:特征灵活

  B:速度快

  C:可容纳较多上下文信息

  D:全局最优

  答案:B

  解析:HMM模型是对转移概率和表现概率直接建模,统计共现概率。而MEMM模型是对转移概率和表现概率建立联合概率,统计时统计的是条件概率。CRF是在给定需要标记的观察序列的条件下,计算整个标记序列的联合概率分布,而不是在给定当前状态条件下,定义下一个状态的状态分布。MEMM容易陷入局部最优,是因为MEMM只在局部做归一化。CRF模型中,统计了全局概率,在做归一化时,考虑了数据在全局的分布,而不是仅仅在局部归一化,这样就解决了MEMM中的标记偏置的问题。

  CRF没有HMM那样严格的独立性假设条件,因而可以容纳任意的上下文信息,特征设计灵活。CRF需要训练的参数更多,与MEMM和HMM相比,它存在训练代价大、复杂度高的缺点。

  ②、概率

  假设一个完整的扑克牌有52张牌,2黑色(黑葵和梅花)和2红色(方块和红心)。如果给你一副完整的牌,和半副牌(1红色和1黑色),则两种情况下抽两张牌都是红色的概率是多少( )

  A:1/2,1/2

  B:25/102,12/50

  C:50/51,24/25

  D:25/51,12/25

  答案:B

  解析:一副牌,第一张为红色的概率为26/52,第二张为红色的概率为25/51,两张都为红色的概率为:26/52*25/51=25/102

  半副牌,第一张为红色的概率为13/26,第二张为红色的概率为12/25,两张都为红色的概率为:13/26*12/25=12/50

  ③、机器学习

  下面关于ID3算法中说法错误的是( )

  A:ID3算法要求特征必须离散化

  B:信息增益可以用熵,而不是GINI系数来计算

  C:选取信息增益最大的特征,作为树的根节点

  D:ID3算法是一个二叉树模型

  答案:D

  解析:ID3算法的核心思想是以信息增益度量属性选择,选择分裂后信息增益最大的属性进行分裂。ID3算法的局限是它的属性只能取离散值,为了使决策树能应用于连续属性值情况,可以使用ID3的一个扩展算法C4.5算法。BC选项都是ID3算法的特点。ID3算法生成的决策树是一棵多叉树,分支的数量取决于分裂属性有多少个不同的取值。因此D选项错误。


【搜狗校招笔试题】相关文章:

阿里巴巴校招笔试题,试题分享08-10

中兴2016年校招笔试题08-16

搜狗招聘笔试题分享08-10

2016银行春季校招笔试题目07-26

招警试题面试:某省招警面试题07-31

迅雷2011.10.21笔试题08-10

中兴2015笔试题08-02

招聘试题三招式08-05

招警考试:招警考试经典面试试题及解析08-09

攒RP 记格兰仕校招面试【08-08