今日阅读:
- 欧洲很小为什么有很多语言? - 黑之圣雷的回答 - 知乎
小结:也是一种统计学上的错觉。
今日软件:
- NSFW detection on the client-side via TensorFlow.js
- NSFW API
- NSFW Detection Machine Learning Model
这几个放在一起说,其实是因为都是 NSFWJS 这个项目的衍生。
目前找到最好的鉴黄免费开源模型就是 NSFWJS ,可以快速地把图片分为五类:
Drawing
- 非色图画作 (包括动漫图片)Hentai
- 动漫色图Neutral
- 非色图普通图片Porn
- 真人色图或色情画作Sexy
- 非色图的露骨性暗示图片
我尝试在腾讯云 VPS 小鸡上部署 docker 的 API 项目,但是小鸡卡死了。
看来只能试一下本地运行模型,还需继续摸索.
- ocr.space
说到 OCR ,这个可能是目前最好用的免费 OCRapi 方案。
免费每月 25000 次调用,1 Mb图像大小上限,有两个模型可以调用,支持 25 种语言,支持识别文字位置返回。
可能唯一的问题就是传参的语言无法设置为自动识别,对于我这种英文、日语、中文图片夹杂的情况,或许要每个跑三遍。
今日代码:
基本没怎么更新 AIForumExplorer ,而是在研究 QQ 群聊天记录获取并总结的玩法。
但是群内很多讨论是由转发的图片延申的,如果无法理解图片内容,就没办法对群聊讨论主题做出很好的概括。所以需要对可能包含讨论内容的图片进行 OCR 然后嵌入回原聊天记录。
不考虑直接使用多模态模型,省时省力的方法就是 OCR 。不过很多图片是分享的动画、照片等无文本信息,扔进 OCR 又耗费资源。比较好的一个方法就是先做图像内容识别,然后对非图画照片等“普通”图像再使用OCR。也是我找到 NSFWJS 的动机。
最近接触的库越来越多是适用于 Nodejs 的,虽然有的也能找到 Python 版本,但是现在看来JS是必须得学的(我只会嵌入网页和油猴脚本那种最基本的用法)。
今日见闻:
Google宣布在5月2日正式发布 Gemini 1.5 Pro API
今日废话:
没干活的原因是晚上跑去玩喷涂了。
结果尝试过海绵上色后惊为天人,又把刚笔涂好的身体件给洗掉重新用海绵涂。这身体件没几天洗了三次,比我洗澡都勤快。
结果用海绵上色身体好像比用海绵上色头发效果差了不止一星半点,对于这种大剑不规则的可能还是得喷涂。而刚用海绵涂好的头发因为我手贱想做渐变,又给涂废掉只能一起清洗。 What can i say?