您的位置首页  网络技术

网络公司项目概述网络安全渗透学习-网络工程师面试题

  Decoder-only:只要解码器,用于从牢固维度的暗示天生输出序列,凡是在天生式使命中利用

网络公司项目概述网络安全渗透学习-网络工程师面试题

  Decoder-only:只要解码器,用于从牢固维度的暗示天生输出序列,凡是在天生式使命中利用。

  Beam search是一种在序列天生使命当选择最优输出序列的搜刮算法。在每步,它保存几率最高的k个候选收集宁静浸透进修,然后按照下一个词的猜测持续扩大这些候选。这个历程不断停止到天生完好序列为止收集公司项目概述。Beam search许可在搜刮空间中停止部分剪枝,以均衡搜刮的广度和深度,进步天生的序列的质量。

  Lora办法指的是在大型言语模子上对指定参数增长分外的低秩矩阵,也就是在原始PLM中间增长一个旁路,做一个降维再升维的操纵收集宁静浸透进修。并在模子锻炼过程当中收集公司项目概述,牢固PLM的参数,只锻炼降维矩阵A与升维矩阵B收集宁静浸透进修。而模子的输入输出维度稳定,输出时将BA与PLM的参数叠加。用随机高斯散布初始化A,用0矩阵初始化B收集公司项目概述。

  Transformer模子由编码器息争码器构成收集宁静浸透进修,其中心是自留意力机制。每一个编码器息争码器均由多个不异的层叠加而成,每层包罗自留意力子层和全毗连前馈收集子层收集公司项目概述。输入序列经由过程多头自留意力机制停止处置,然后经由过程前馈收集。每一个子层后都有残差毗连和层尺度化。编码器息争码器之间经由过程编码器-解码器留意力毗连收集宁静浸透进修。

  混淆精度指的是在模子锻炼中同时利用fp16和fp32,以在计较中进步服从。凡是,模子参数利用fp16暗示,而梯度和积累值利用fp32暗示。如许能够削减内存占用和计较开消,加快锻炼历程。

  Encoder-decoder:同时包罗编码器息争码器,用于序列到序列的使命,如机械翻译。编码器将输入序列编码成高低文信息,解码器利用该信息天生输出序列。

  翻译使命次要利用的是seq2seq架构,今朝支流的翻译架构是基于Transformer模子的,它接纳自留意力机制(self-attention)来捕获输入序列中差别地位的联系关系信息,并经由过程编码器-解码器构造来完成翻译。

  GBDT(Gradient Boosting Decision Tree)是一种集成进修办法收集宁静浸透进修,它经由过程迭代锻炼决议计划树,每次迭代都试图改正前一次迭代的毛病。详细而言,GBDT经由过程拟合残差(目的值与当前模子的猜测之差)来逐渐改良模子。在每轮迭代中,新的决议计划树被锻炼以捕获残差中的形式收集公司项目概述。终极,一切树的猜测被组合起来构成终极的猜测模子。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
  • 标签:网络工程师面试题
  • 编辑:田佳
  • 相关文章