第13章 兑换!
伴随系统提示音落下,一股关于文本分析的庞大信息流,便径直涌入沈庭的脑海。
文本分析的核心框架与技法,大致分为三个部分:
首先是书面语言分析,聚焦于“用语习惯”。
每个人的用词遣句,都有着自身的独特性。
这与地域、职业、教育背景、文化熏陶乃至时代特征息息相关。
分析文本中反复出现的特色词汇、非常规搭配、特定领域的术语或黑话,甚至语法结构的偏好,就能逆向推断出书写者的成长环境、可能籍贯、从事的职业或长期沉浸的亚文化圈。
比如,频繁使用“俺”、“咱”自称,可能指向北方某些方言区。
习惯用“啥”代替“什么”,也有其地域倾向。
某些特殊的儿化音运用,如“这人儿”,同样可以成为线索。
而文本中,如果出现了“账户对冲”、“杠杆比率”、“量化宽松”等术语,那么书写者很可能从事金融或相关行业。
若满是计算机代码缩写或网络黑客俚语,背景自然指向计算机领域。
其次,是文字布局与格式分析,也称为“空间表达”。
研究表明,字迹在纸张上的整体排布方式,包括页边距的宽窄、行间距的疏密、字与字之间的拥挤或松散程度,以及每行字迹基线的整体走向,是平直、上翘还是下滑……
这些宏观特征,往往与书写者当下的情绪状态、长期性格倾向、甚至潜意识的心理活动有关。
比如,如果通篇留白极多、字距稀疏,可能暗示书写者性格孤僻、喜欢保持距离感;