网络健康社区中0~3岁婴幼儿母亲育儿需求和情感因素的调查以“妈妈网”中“婴幼儿版块”为例 唐苗苗,兰 强,谭瑾蓉(1.西北师范大学教育科学学院,甘肃 兰州 730070;2.广西科技师范学院外国语学院,广西 来宾 546199;3.天水师范学院教师教育学院,甘肃 天水 741001)女性一生中可以充当许多角色,其中成为一个母亲对于女性意味着人生中的重大转折,新手妈妈育儿往往更加具有挑战[1]新手妈妈在面对新的生命时,常常会遇到科学喂养、调节情绪、产后护理等问题[2]在女性向准妈妈迈进的过程中,会出现情绪易波动的现象[3],例如母亲在生完孩子后的喜悦常常伴随这生育过程中的疲惫、家庭矛盾、自我效能感的低下等问题[4]主要原因在于从女性到母亲这个角色转换的过程中,很多新手妈妈对于自己是否能教养好自己的孩子持怀疑态度、不了解自己和孩子的身体状况、社会中也缺乏相应的支持机构随着时代的发展,母亲越来越关注婴幼儿的发育、婴幼儿摄取的营养、药物对婴幼儿的危害以及产后如何护理等话题[5],新手妈妈在育儿的过程中需要哪些信息、这些信息可以折射出哪些问题,逐渐引起大量学者的关注将主题挖掘与情感分析结合,可以在获取热门主题的同时了解网民群体的情感倾向,有助于监测网络舆情的发展趋势,从而做出准确的舆论引导工作。
Web2.0环境中,社交网络将用户信息进行隐藏,提出了一种可溯源的隐私保护方案,使新手妈妈更加倾向于通过网络健康社区的渠道来解决自己实际生活中遇到的问题[6]本文运用数据挖掘、内容分析的方法,将网络健康社区作为数据来源点,以女性在身份转换期时的关注点、情感表现和情绪表达为切入点,试图通过科学的数据分析为女性育儿提供了重要参考一、国内外研究现状Oosthuizen等学者认为生育是女性重要的转折点之一[7]Grande的研究发现,很大一部分女性在孩子出生之前没有做好充分的准备,并且产后情绪波动大,在照顾新生儿的过程中产生不同程度的疲惫[13]临床心理学家阿比丁(Abidin.R.R.)首先提出了育儿压力(Parenting Stress)这个词,是指父母在执行家长角色和亲子互动时,受到其个体人格特征、亲子互动关系、子女特质和家庭环境因素作用而产生的紧张情绪[8]最初的育儿压力概念多是从“压力源”角度出发来探讨,即指父母因自身原因或由于养育孩子不当而造成儿童问题行为的情绪体验,后来的研究者们更多地在阿比丁育儿压力定义的基础上加以修正与提高,将育儿压力视为父母在可获得社会支持资源无法满足育儿需求时产生的一种负面自我评估[15]。
近年来随着心理学、教育学以及社会学领域关于育儿压力相关理论与实践研究成果的增多,育儿压力也逐渐被纳入了教育心理学、社会医学等学科研究范畴本研究将育儿压力定义为“家长在育儿过程中,受到家长个人、子女方面、亲子互动关系、家庭情境、社会支持等作用,育儿需求得不到满足时所带来的压力感,会产生焦虑、不安、社会地位丧失感、身体疲劳等其他情绪体验和状态”[9]Jeongmin的研究表明人们更愿意在相对安全的环境中公开自己的信息,并且寻求帮助,如果信息相对公开可能存在“判断风险”等问题[10]新手妈妈们在信息获取时,一是担心自己问一些有争议和敏感话题时会被熟悉的人、或者专业人士“评判”;二是由于该阶段的女性存在特殊性,缺乏时间、社交圈变小等,存在很大的信息壁垒[11]故此,网络社区很好的提高了用户信息的隐私性,并且数据全面,可以很好的回答准妈妈们在养育婴儿时存在的问题,成为0~3岁婴幼儿母亲在信息搜索时的重要信息来源和传统的网络信息和获取方式不同,该网络环境在获取信息时更加注重打破信息壁垒,且提高了用户信息的隐秘性[12]用户在表达自己的信息时情感是重要的驱动性因素之一,消极情感或是负面情绪会提高信息搜索行为。
Wichers经过大量实验表明,用户消极情感会提高信息搜索比率[13]Jennings等研究新手妈妈,尤其是年轻单身母亲,发现此类妈妈的情绪更为消极并且信息需求量更大[14]相反另一些学者证明,在网络中进行讨论可以让年轻妈妈们得到专业的理论指导来获得情感支持[15]经过进一步的研究,发现网络论坛中有许多积极因素能够提高母亲的情绪指数[16]年轻妈妈们可以把网络论坛作为一个表达自己的负面、消极情绪的平台,她们将自己以及身边所遇到的问题输入该平台,以此交流日常生活中育儿的经验以及表达自己的情绪由此,近年来用户信息行为成为热门话题,但是却没有重视从年轻女性到“新手妈妈”身份过度的信息行为二、研究设计和获取数据数据挖掘是将算法与相应的软件相结合,在由一定的数据统计工具从网络社交环境中分析所得数据的一种方式,可以从更深层、更细节、并且根据数据提供更有知识价值的参考本文通过自动抓取社交论坛中的数据,并将数据挖掘技术与“新手妈妈”们的论坛主题相结合,进行文本的数据收集以及比对一)数据来源与数据获取根据2022年数据统计,与其他国内十大知名品牌相比,“妈妈网”备受成为母亲的女性欢迎,并且作为母婴网站的“领头羊”最具代表性,因此本文选取“妈妈网”作为研究数据来源[17]。
与其他高级语言不同的是,Python具有更加显著的优势[18]首先,Python语法结构、编译过程、简单易理解其次,Python与第三方库相互连接,库内Requests、BeautifulSoup、Scrapy等第三方数据,通过对这些库的检索,可以提高数据收集时的效率并且实现各种功能采用Python编程,实现了数据的自动抓取选取“妈妈网”论坛2018年1月至2022年12月“婴幼儿版块”所有帖子标题及内容文本,形成研究基础文本数据集全部发帖的题目及内容文本构成了一个基本的研究文本数据集,数据集时间段月发帖量散点图见图1图1 日发帖量统计分布(二)数据处理与分析方法首先,从选定的统计数据中剔除内容、标题不具有参考价值的以及因内容不合规范而被管理员删除造成内容无法正常显示的情况,剩余1506832条帖子为文本库进行数据研究其次,以结巴分词的方式将帖子标题和文本内容分类,并结合结巴分词的停用词表与对比文本内容,后续的数据研究中将不考虑这些停用词1.主题抽取方法利用LDA完成数据集中主题词抽取LDA(Latent Dirichlet Allocation)[19]是Blei于2003年提出的三层贝叶斯主题模型。
此模型假设文本中的每一个词都带有隐藏的情感含义,该模型将这些特征词从不同方面进行比较,并筛选出相应的词汇建立一个信息库例如N个词汇表的单词被包含于M个文档的语料库{w1,w2 …,wm}中,LDA假定在研究用文档中存在K种潜在的主题如果这些文本有相同的主题或相似的内容,则将其作为训练集,使用随机森林算法来对它们进行分类在一个文档中,每个词wi将关联到隐藏的变量zi∈{1,...,K},说明从wi中产生话题单词wi出现的概率可表示为:P(wi)=∑P(wi|zi=j)P(zi=j)这里的P(wi|zi=j)=βij是主题j中单词wi的概率,P(z=j)=θj为一个特定文档的混合权值,表示主题j在文档中所占的百分比该研究采用了Gensim库所提供的LDA建模方法,该模型采用标准参数(alpha='symmetric',eta=None,de-cay=0.5,eval_every=10,iterations=50,gamma_thresh-old=0.001,update_every=1),10~50是主题词设置的范围,通过对Key的分析,确定了具有明确含义和分类的主题,并将其划分为28个,经过整合,最终构建出221个主题。
2.情感分析方法就情感分析而言,内容分析法应用最广泛,而自动化分析则是近几年内容分析应用最频繁的方法[20]在研究的过程中,我们对“妈妈网”用户搜索到的数据自动进行文本分析,从而对隐藏在数据当中的真实感受进行研究大连理工大学研究者构建了7大类、21小类的情感词共计27466个中文情感词汇本体[21]该词库对于分析中文文本情感和倾向性提供有效支持,其适用范围更广、数据更加可靠,可以识别人类多种情感因此我们将“妈妈网”中收集到的数据与该情绪分类词典进行比对,运用科技手段对新手妈妈或者有孩子的女性进行分析首先,收集论坛中506832条帖子,运用结巴分词将标题以及文本所构成的内容中有关情感的词汇进行分析,找出情感词和词典中的对应关系,并确定每一个词表达的情感类型,将这些数据做一个归类,将表达不同情感的帖子进行分类其次,为了更好的对“新手妈妈”们的情感做出准确的分析,我们将原有的数据库字典进行优化,将表示情感的词细化,如“赞扬”替代“感谢”;“慌”代替“慌张”;“思”替换“思念”;“羞”替代“羞涩”;“疚”替换“愧疚”等,用来提高搜索的精确度[22]最后,通过Pearson相关检验,我们对每个帖子的主题进行了测量,并计算出其中包含的情感值,将主题与情感在文档中的位置分布进行量化,以分析帖子表达的主题与发帖者情感之间的关系强弱。
三、数据分析与讨论(一)信息需求主题分析词云和词频统计可以很好的直接展示信息需求的主题,表1对社交论坛中的18个主题进行了随机抽取,并计算出排名、比重以及对应的Key表1 信息需求主题分析由表1可见,0~3岁婴幼儿母亲在信息搜索时不止局限于一个方面,其中包含了自身和孩子两个板块新手妈妈”在社交网络上最喜爱搜索的主题包含了关注自身身体是否健康、产后情绪的波动、妇科疾病、产后恢复、社会支持等,内容从自身的健康到关注社会,关注面广泛、全面、且信息需求量大随着互联网的发展以及网络环境的安全系数的提高,会有越来越多的年轻妈妈们在社交媒体或网络上搜索自己的问题、并且依赖程度也会逐步上升总结以上主题,可以很清晰的看到“幼儿照料”“发育问题”“产后康复”等主题是妈妈们最关注的,其次是“并发症”“幼儿早教”从搜索的主题来看,首先这些问题在日常生活中涉及隐私,一些女性由于害羞或者不愿意麻烦他人的想法,更愿意在社交网络中询问;其次这些问题很琐碎无法经常询问他人;最后,初为人母的女性在获得的信息上不对等、信息壁垒等问题突出,于是大多数女性会在网络中寻求答案将每一个不同类型的主题和对应帖子的内容进行比较,我们发现,发帖的主人不论在搜索信息还是寻求帮助,都很注重相同经历,更愿意相信和自己有着相似处境的人群。
如:“我特别苦恼,我只要离开宝宝的视线,宝宝就会哭闹个不停,跪求姐妹们推荐好的办法”“宝妈们有没有产后漏尿的尴尬情况,姐妹们我知道一个医生看的特别好,需要的联系”“宝宝身体素质差,导致容易拉肚子,有没有姐妹和我是一样的情况”这些问题和诉求都反映出该阶段的女性既敏感有脆弱,并且在搜索问题时,更倾向于和自己有相同经历的母亲,这也验证了部分学者的假设,共同经历很重要[23]身体不适”“愿望祈求”“幼儿照料”也是女性在备孕期间较为关注的话题,其中“兼职工作”“愿望祈求”这两个话题在0~3岁婴幼儿母亲中更为常见,这两个主题反映了女性内心的需要和对现实生活的诉求,我们可以对这两个话题进行更加多元的讨论二)情绪分析通过大连理工大学的情感词典,我们可以自动识别出21种不同的情绪类别具体类型及其所包含帖子数量的占比如图2所示图2 帖子主题情绪类型及其占比图2所示,本文将21类情绪从不同情感和状态中总结出三大类情绪,即积极情绪、消极情绪和中性情绪(也可称中立情绪)快乐”“赞扬”可以归为积极情绪,这两个Key排名靠前,比重偏高,这可以说明,0~3岁婴幼儿母亲在社交平台中表达的是积极向上的情绪,或者也可以说在平台交流中,妈妈们更多的得到了一种积极的情绪反馈。
将带有积极情绪主题的相关帖子进行内容上的比对,可以看出,首先是0~3岁婴幼儿母亲在自己困惑是因为得到了较多人的帮助而。