学术报告
-
Automated Machine Learning
机器学习是件很复杂的事情,在机器学习向更多领域扩展的时候,遇到了机器学习专家这一资源的限制。自动机器学习(Automated Machine Learning)就是尝试去解决这一问题,它试图用一个自动的系统代替人去做机器学习这整个过程。本次报告介绍了在自动机器学习中应用的各种搜索策略,并…
-
active self-paced learning
在机器学习中获得标注数据是一个重要的部分。但是在一些专业领域,标注成本高,成本高,导致了获得标注数据困难。主动学习的方法能够有效的节约标注成本。但是传统主动学习方法往往注重低置信度样本的挑选,而忽略高置信度样本的标注和使用。本次报告就讲述一个结合自步学习的主动学习模型框架ASPL,解决高…
-
高斯混合模型及求解算法
高斯混合模型(Gaussian mixture model,GMM)用于对样本的概率密度分布进行估计,而估计采用的模型(训练模型)是几个高斯模型的加权和。每个高斯模型就代表了一个类。对样本中的数据分别在几个高斯模型上投影,就会分别得到各个类上的概率,然后我们可以选取概率最大的类作为判决结…
-
Not all bytes are equal Neural byte siev
简单高效的漏洞检测方法一直是信息系统安全领域研究的热点,微软研究人员借助机器学习和深度神经网络开发出一种用于发现软件安全漏洞的新方法,这个名为“神经网络模糊测试”的最新研究项目旨在对传统模糊测试技术加以强化,而且早期实验已经显现出良好的效果。研究通过在灰箱模糊测试器的反馈回路中插入一个深…
-
Fast bin attack & Unsorted bin attack
简单介绍了堆的管理与分配,主要讲述了堆上两种典型的攻击方式,即fast bin attack 和 Unsorted bin attack,他们分别利用了单向链表和双向链表在卸载chunk时的操作机制,造成任意地址的写。最后通过一个结合fast bin chunk精巧构造Unsorted …
-
CSRF跨站请求伪造
CSRF(Cross-site request forgery)全称跨站请求伪造,是利用受害者尚未失效的身份认证信息(cookie、session等),诱骗其点击恶意链接或者访问包含攻击代码的页面,在受害人不知情的情况下以受害者的身份向(身份认证信息所对应的)服务器发送请求,从而完成非法…
-
符号执行简介
符号执行 (Symbolic Execution)是一种程序分析技术。其可以通过分析程序来得到让特定代码区域执行的输入。使用符号执行分析一个程序时,该程序会使用符号值作为输入,而非一般执行程序时使用的具体值。在达到目标代码时,分析器可以得到相应的路径约束,然后通过约束求解器来得…
-
Using Sentiment Representation Learning to Enhance Gender Classification for User Profiling
用户画像意味着利用机器学习技术来预测用户的属性,例如人口统计学属性,兴趣属性,偏好属性等。它是精确营销的强大数据支持。现有方法主要研究网络行为,个人偏好,发布文本以构建用户画像。随着社交网络的不断发展,微博已成为人们日常生活的重要社交平台,活跃的用户活动带来了大量的网络数据,这为用户画像…