大邓和他的Python
-
bidict库 | Python双向映射功能,让字典更好用
字典是一种键值对key-value pair数据结构, 用key查询到对应的值value, 但不能用value查到对应的key。但有时我们面对的分析任务,需要用value查到对应的…
-
预训练模型 | 使用1000w专利摘要训练word2vec模型,可用于开发词典
一、说明 3571万条专利申请数据集(1985-2022年) 中随机抽取了28%的 「专利摘要」,构成6.14G的训练语料(千万级别), 耗时6小时,训练得到word2v…
-
MS | 使用网络算法识别创新的颠覆性与否
颠覆式创新是一个很火的概念,在创新创业、科学学等研究中,每个专利、论文的正文中都会引用关系,而引用关系会构成一个引用网络。 那么创新如何从网络形态进行区分,如何计算网络节点的创新程…
-
关于”滥用原创”, 做一些情况说明
2023-11-06 16:27 ~ 2023-11-7 12:37, 公众号遇到8个举报, 举报『公众号:大邓和他的Python』存在『滥用原创』标记违规行为, 作此文说明一下情…
-
OS2022 | 概念空间 | 词嵌入模型如何为组织科学中的测量和理论提供信息
Aceves, Pedro, and James A. Evans. “Mobilizing conceptual spaces: How word embedding…
-
MS | 使用语言差异性测量团队认知差异性
词嵌入在经管中的应用很多,但大多数是训练词嵌入模型,依据词嵌入构建或扩展词典。今天我们将分享一篇用词嵌入测量团队认知多样性。 一、研究 Lix, Katharina, Amir G…
-
案例代码 | 使用正则表达式判别微博用户mbti类型
使用Python爬虫采集「微博搜索」中含mbti信息的推文, 使用正则表达式判别用户mbti类型。相比实验室做实验或者发调查问卷,这种方式收集到的用户类别是非常自然且真实…
-
GTE中文通用文本向量表示模型
GTE中文通用文本表示模型 文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展,尤其是预训练语…
-
心理科学进展 | 语义距离与创造性思维关系的元分析
博客之前分享过 PNAS(含代码) | 使用语义距离测量一个人的创新力(发散思维)得分 , 通过语义距离测量创新力, 该教程含Python代码。今天摘抄一篇<心理科学进展&g…
-
JMR | 测量消费者的语言确定性
一、文献 Rocklage Matthew D.,He Sharlene,Rucker Derek D.,Nordgren Loran F..Beyond Sentiment: T…