Hello, I’m Pilgrim

Designs, talks, and writes about web, ethics, privacy, and dev. I share design tutorials, free resources and inspiration. Loves music & riding his bicycle.

Latest Posts

Detecting Images Generated by Deep Diffusion Models using their Local Intrinsic Dimensionality

arxiv,GitHub ABSTRACT 1 INTRODUCTION 2 RELATED WORK 3 METHOD 4 EXPERIMENTS 4.1 Datasets 公开可用的数据集,意思是要读者自己收集: CiFake [7],The generation of synthetics is carried out by ...

PROBING BERT IN HYPERBOLIC SPACES

arxiv,GitHub ABSTRACT 最近,人们提出了各种探测任务,以发现在语境化词嵌入中学习到的语言属性。这些工作中的许多隐含假设这些嵌入位于某些度量空间中,通常是欧几里得空间。本文考虑了一类几何特殊空间,即双曲空间,对层次结构表现出更好的归纳偏差,并可能更好地揭示在上下文表示中编码的语言层次。本文提出庞加莱探针,一种结构探针,将这些嵌入投影到具...

ArguGPT evaluating understanding and identifying argumentative essays generated by GPT models

arxiv,Github Abstract 人工智能模型生成的内容对世界各地的教育工作者提出了相当大的挑战。当学生提交AI生成内容(AIGC)作为自己的工作时,教师将需要能够用肉眼或借助一些工具检测此类文本。对AIGC的词法、句法和文体特征的了解也越来越迫切。 为解决英语语言教学背景下的这些挑战,本文首先提出ArguGPT,一个精心平衡的语料库,由7个...

On the Reliability of Watermarks for Large Language Models

arxiv,Github 本文研究现实中使用水印的可靠性,结论是,带水印的文本在被人类重写、由非带水印的LLM转述或混合成更长的手写文档后,水印仍然是可检测的;此外提出了对短跨度水印敏感的新检测方案 3 How to improve watermark reliability? 本节针对 Green List 进行改进,前面稍微介绍了一下 Gree...

Can AI-Generated Text be Reliably Detected?

arxiv,Github 前言 主要动机是对现有的 AI 生成内容检测器 进行攻击,包括paraphrasing attacks,recursive paraphrasing attacks 和 spoofing attacks,攻击对象包括 neural network-based detectors, zero-shot classifiers,re...