乔治城探究项目:基于大数据的网络暴力语言的自动检测

Description

乔治城探究项目:

基于大数据的网络暴力语言的自动检测

课题简介

自然语言处理是深度学习与人工智能领域中的一个重要方向。它涉及人与计算机之间用自然语言进行有效通信的各种理论和方法。 自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言 。

在如今的网络时代,每个人都可能成为网络暴力的受害者。网络暴力的肆无忌惮,正以其独有的方式破坏着公共规则,破坏着道德底线。而网络谩骂,更是网络暴力最常见的表现形式,本课题所要着重探讨的,就是如何利用大数据以及人工智能技术,实现计算机大规模快速的识别这些网络污秽语言 。

本课题旨在以语义分析为依托,对机器学习项目的整个生命周期,从数据获取,数据清理,数据可视化,建立机器学习模型,到最后的优化模型进行深入浅出的理论介绍与实战模拟。让学生在最短的时间内,获得密度最大的知识。本课题设计弹性大,可按照学生的学习能力和主要兴趣进行课程安排。比如喜欢挑战自我,学有余力的同学, 课题中可以加入更多最前沿最复杂的诸如注意力模型,capsule胶囊模型等技术。

 

科研方法

AI+X数据驱动型科研

AI+X数据驱动型科研是指使用人工智能(AI)算法,收集、处理、分析具体学科(X)的海量数据,并基于此进行预测,从而获得科学发现的研究方法。与传统的、基于实验或逻辑推理的研究方式相比,AI+X数据驱动型科研可以借助AI算法强大的运算能力,高效地进行大数据分析,具有投入产出比高、适用范围广的优点。

AI+X数据驱动型科研已被广泛地应用于各个领域,利用AI算法研究基因数据,从而进行早期的癌症筛查便是其中一例。基因组与癌症病患的数据千千万万,使用传统的科研方式对其进行分析,工程量大、过程繁琐,在客观上难以实现。但借助AI算法这一便捷的工具,生命科学家便能够以海量的患者的遗传信息为基础,建立数据库,与过往的研究成果进行对照,快速、准确地在两者中发现规律、建立联系,从而使癌症诊断的“标准化”成为可能。

 


高中生/本科生 科研项目
资讯 · 课程 · 全程指导
请扫码添加微信好友

有方背景提升科研项目计算机工程
联系电话:134 7257 6903


授课导师

1. 乔治城大学研究生

2. 研究方向是人工智能算法、计算机视觉、云计算;

3. 曾担任Consumer Report机器学习算法实习顾问。

 

课题要求

本课题适合: 9-12 年级学生,有较强的逻辑思维和抽象思维能力:

英文:
1、具备基本的学术英语阅读能力;
2、接触过英文写作,能初步撰写英文文章;

 

数学:
1、对数学感兴趣、乐于积极学习数学新概念;
2、最好有一定微积分基础;

 

计算机:
最好有一种或多种编程软件使用经验。