文本挖掘 | Text mining
网络上存在大量的数字化文本,通过文本挖掘我们可以获得很多有价值的信息,本文告诉大家什么是文本挖掘,以及他的处理步骤和常用的处理方法。
深度学习 ( Deep Learning | DL)
一文看懂深度学习 ( Deep Learning | DL),详细的给大家介绍深度学习的基本概念、优缺点和主流的几种算法,小白也能看懂。
分词 | Tokenization
token是什么?在大模型中调用接口是不是经常遇到token数限制?本文用白话文介绍下中英文Tokenization。
依存句法分析 | Constituency-based parse trees
一文看懂依存句法分析(Constituency-based parse trees),用简单的白话文讲解,菜鸟也能看懂。
成分句法分析 | phrase structure grammars
一文看懂成分句法分析(phrase structure grammars)
词转向量 | Word2vec
词转向量(Word2vec)就是将现实问题转化为数学问题,说白了就是人类能理解的内容转化为计算机能理解的内容。
训练集、验证集、测试集(含 分割方法+交叉验证)
一文看懂人工智能技术里面的训练集、验证集、测试集,用简单的白话文讲解,包含分割方法和交叉验证,菜鸟也能看懂。
词嵌入 | Word embedding
一文看懂词嵌入(Word embedding),用简单的白话文讲解,菜鸟也能看懂。
朴素贝叶斯 (Naive Bayes Classifier | NBC)
朴素贝叶斯 (Naive Bayes Classifier | NBC)是一种简单但令人惊讶的强大的预测建模算法。
K均值聚类 | k-means clustering
聚类算法又叫做“无监督分类”,其目的是将数据划分成有意义或有用的组(或簇)。这种划分可以基于业务需求或建模需求来完成,也可以单纯地帮助我们探索数据的自然结构和分布。