【人工智能】AI竟潜藏第二黑暗人格 | OpenAI最新研究 | 涌现性失调 | 泛化 | 推理模型更甚 | 稀疏自编码器SAE | 失调人格特征 | 有毒人格 | 涌现式重对齐 | 人类引导AI向善 | 最佳拍档 | Podwise