数据:网页源码
目的:提取特征或者打码分类
您确定要删除本贴么?所有相关回复也会被一并删除并且无法恢复。
seven 2020-12-15 17:05
爬虫而来数据? 有具体样例没有
boyang987 2021-03-09 15:56
html元数据里一般会有给搜索引擎用的keywords,此外可以在body的标题标签里提取高频的关键词
lingf33 2021-07-27 16:51
回答问题时需要注意什么?
我们谢绝在回答前讲“生动”的故事。 我们谢绝答非所问。 我们谢绝自己不会、硬要回答。我们谢绝“这么简单,自己想”、“书上有,自己找”这类回答;如果你认为对方提问方式或者内容不妥,可以直接忽略,不作解答,甚至投反对票。我们感激每一个用户在编写答案时的努力与付出!
相关讨论
请问汉字CNN识别,怎么做标签呢?
不同mini-batch的LSTM_cell之间的隐藏状态(hidden state)和记忆单元(memory cell)的确定
hidden size
python随机打乱文本
可以把多个文档、段落向量直接加和求平均来获得新的表示向量吗?
text CNN的输入训练样本有什么要求?
nlp里的stemming是什么意思?
文本处理中的tf是什么意思?如何计算?
怎么判断一句中文话语是否通顺
文本处理中stop word什么意思
随便看看
机器学习中的奥卡姆剃刀原理是什么意思
python sklearn模型中random_state参数的意义
主成分分析法(PCA)算是黑盒算法吗?
推荐系统里的ALS是什么意思?
AIC可以是负数吗?