英文: Hugging face transformer: model bio_ClinicalBERT not trained for any of the task? 问题 这可能是最基础的问题之...
TFIDFVectorizer 制作拼接的单词标记
英文: TFIDFVectorizer making concatenated word tokens 问题 我正在使用Cranfield数据集来创建一个索引器和查询处理器。为此,我使用TFIDFVe...
嵌入元素在HuggingFace的BERT模型中代表什么?
英文: What does the embedding elements stand for in huggingFace bert model? 问题 在BERT模型中,在将我的标记通过编码器之前,...
创建基于另一个数据集的作者的数据集。
英文: Create datasets based on authors from another dataset 问题 我有一个以以下格式的数据集 text author title -------...
如何深入研究NLP库(如spacy/NLTK)的语言特征?
英文: How do I study linguistic features of NLP libraries like spacy/NLTK in-depth? 问题 我的目标 我正在尝试使用spa...
如何安装Detectron2
英文: How to install Detectron2 问题 以下是翻译好的内容: I am installing layout-parser and following this link. D...
上传文本文档到 R
英文: Upload text document in R 问题 我正在尝试将多个文本文档上传到R中的数据框中。我的期望输出是一个具有两列的矩阵: DOCUMENT CONTENT Document ...
构建Tensorflow数据集并使用map方法应用TextVectorization层
英文: Constructing Tensorflow Dataset and applying TextVectorization layer using map method 问题 我试图构建一个...
我不想通过将单词拆分为字母来删除停用词。
英文: I don't want to remove stop words by splitting words into letters 问题 我正在编写这段代码来从我的文本中去除停用词。 ...
识别列描述中的个人信息
英文: Identifying personnal information from column description 问题 我有一个关于识别与GDPR(通用数据保护条例)相关的句子的问题。 是否...
11