2024年4月5日我学到了什么

今日阅读：

欧洲很小为什么有很多语言？ - 黑之圣雷的回答 - 知乎
小结：也是一种统计学上的错觉。

今日软件：

NSFW detection on the client-side via TensorFlow.js
NSFW API
NSFW Detection Machine Learning Model
这几个放在一起说，其实是因为都是 NSFWJS 这个项目的衍生。
目前找到最好的鉴黄免费开源模型就是 NSFWJS ，可以快速地把图片分为五类：

Drawing - 非色图画作 (包括动漫图片)
Hentai - 动漫色图
Neutral - 非色图普通图片
Porn - 真人色图或色情画作
Sexy - 非色图的露骨性暗示图片
我尝试在腾讯云 VPS 小鸡上部署 docker 的 API 项目，但是小鸡卡死了。
看来只能试一下本地运行模型，还需继续摸索.

ocr.space
说到 OCR ，这个可能是目前最好用的免费 OCRapi 方案。
免费每月 25000 次调用，1 Mb图像大小上限，有两个模型可以调用，支持 25 种语言，支持识别文字位置返回。
可能唯一的问题就是传参的语言无法设置为自动识别，对于我这种英文、日语、中文图片夹杂的情况，或许要每个跑三遍。

今日代码：

基本没怎么更新 AIForumExplorer ，而是在研究 QQ 群聊天记录获取并总结的玩法。
但是群内很多讨论是由转发的图片延申的，如果无法理解图片内容，就没办法对群聊讨论主题做出很好的概括。所以需要对可能包含讨论内容的图片进行 OCR 然后嵌入回原聊天记录。不考虑直接使用多模态模型，省时省力的方法就是 OCR 。不过很多图片是分享的动画、照片等无文本信息，扔进 OCR 又耗费资源。比较好的一个方法就是先做图像内容识别，然后对非图画照片等“普通”图像再使用OCR。也是我找到 NSFWJS 的动机。
最近接触的库越来越多是适用于 Nodejs 的，虽然有的也能找到 Python 版本，但是现在看来JS是必须得学的（我只会嵌入网页和油猴脚本那种最基本的用法）。

今日见闻：

Google宣布在5月2日正式发布 Gemini 1.5 Pro API

今日废话：

没干活的原因是晚上跑去玩喷涂了。
结果尝试过海绵上色后惊为天人，又把刚笔涂好的身体件给洗掉重新用海绵涂。这身体件没几天洗了三次，比我洗澡都勤快。
结果用海绵上色身体好像比用海绵上色头发效果差了不止一星半点，对于这种大剑不规则的可能还是得喷涂。而刚用海绵涂好的头发因为我手贱想做渐变，又给涂废掉只能一起清洗。 What can i say？

🥝 NBXX的博客

探索

2024年4月5日我学到了什么

今日阅读：

今日软件：

今日代码：

今日见闻：

今日废话：

关系图谱

目录

反向链接

最新博文

2025年10月17日我学到了什么

10月

2025年10月11日我学到了什么

2025年9月30日我学到了什么

2025年9月29日我学到了什么