第322期 — 2025-06-28

在浏览器中阅读

周e信

扫描二维码关注微信公众号

Node.js

nodejs序列化各种方式比较🔗

JSON和其他Protobuf、Msgpackr(纯js)、Avro,

Adam Faulkner

Snouzy

Javascript

Web 爬虫程序和爬虫程序检测技术简史🔗

其中一项,对于破解验证码的工作外包给真实的人

Oleg Wock

Harper – Grammarly 的开源离线替代品 - 语法检查器🔗

目前只支持english,但其机制支持扩展到其他语言

Automattic

前端

Warka - react电子墨水屏ui框架🔗

实际图像由后端(python)绘制

Moez Ezzeddine

Kaycee Ingram

移动端

将一台旧的iPhone 8改造成太阳能供电的视觉OCR服务器🔗
  • 使用SwiftUI编写iOS应用,利用Apple Vision框架进行本地OCR处理。
  • EcoFlow River 2 Pro提供电力,通过太阳能充电。
  • Mini PC负责web服务和API路由,并通过Tailscale网络连接所有设备。`

    评论区神吐槽:节约的费用不够交给apple的开发者年费

Hemant Kumar

三星在西亚和北非地区的手机上嵌入IronSource间谍软件应用程序🔗

作者SMEX (黎巴嫩NGO) 指出在西亚和北非 (WANA) 地区销售的三星A和M系列智能手机预装了一款名为AppCloud的流氓软件,用户对此表示担忧。该软件由以色列公司ironSource(现已被美国Unity公司收购)开发,会在用户不知情或未经同意的情况下收集敏感个人数据,且无法在不影响设备安全性的情况下移除。

SMEX

人工智能

Anthropic公司在构建LLM Agent方面的经验🔗

强调了简单、可组合的模式的重要性,并分享了构建高效Agent的实用建议。

  • Agent的定义: Agent系统分为两种:

    • Workflow: LLM和工具通过预定义的代码路径进行编排。
    • Agent: LLM动态地指导其自身流程和工具使用,自主控制任务完成方式。
  • 何时使用Agent: 优先选择最简单的解决方案,仅在必要时增加复杂性。Workflow适用于定义明确的任务,而Agent更适合需要灵活性和模型驱动决策的场景。
  • 关于框架: 框架可以简化初始开发,但也可能增加抽象层,使得调试更加困难。建议先直接使用LLM API,并在使用框架时理解底层代码。

构建成功的LLM Agent的关键在于选择合适的系统,从简单的Prompt开始,进行全面的评估和优化,并在必要时才添加多步骤的Agent系统。应坚持设计简洁、过程透明、精心设计Agent与计算机的接口等原则。

Erik Schluntz and Barry Zhang

Kade Killary

miniDiffusion - 纯 PyTorch 从头开始重新实现了 Stable Diffusion 3.5🔗

该网页内容介绍了一个名为 miniDiffusion 的项目,它是一个使用纯 PyTorch 从头开始重新实现的 Stable Diffusion 3.5 模型。

核心内容:

  • 目的: 该项目旨在用于教育、实验和破解用途,目标是以最少的代码重现 Stable Diffusion 3.5。
  • 代码结构:

    • dit.py, dit_components.py, attention.py:包含主要的 Stable Diffusion 模型代码。dit.py是主模型,dit_components.py包含 embedding, normalization, patch embedding 等辅助函数,attention.py包含 Joint Attention 的实现。
    • noise.py:包含用于求解 Rectified Flow ODE 的 Euler 调度器。
    • t5_encoder.py, clip.py, tokenizer.py:包含文本编码器(T5 和 CLIP)及其分词器。
    • metrics.py:实现了 Fréchet inception distance (FID) 评估指标。
    • common.py:包含训练的辅助函数。
    • common_ds.py:实现了将图像数据转换为 DiT 模型可训练数据的可迭代数据集。
    • encoders 文件夹:保存 VAE, CLIP 等模块的 checkpoint。
    • model 文件夹:训练后保存模型 checkpoint 和 logs。
  • 组件:

    • VAE, CLIP 和 T5 文本编码器的实现。
    • Byte-Pair & Unigram 分词器。
    • SD3 组件,包括 Multi-Modal Diffusion Transformer Model,Flow-Matching Euler Scheduler,Logit-Normal Sampling,Joint Attention。
  • 使用方法:

    • 克隆仓库:git clone "https://github.com/yousef-rafat/miniDiffusion"
    • 安装依赖:pip install -r requirements.txt
    • 安装模型 Checkpoint:在 get_checkpoints.py 中添加 Hugging Face Token,然后运行 python3 encoders/get_checkpoints.py
  • 许可协议: 该项目使用 MIT 许可证。
  • 警告: 该项目仍处于实验阶段,需要更多测试。

yousef-rafat

无人驾驶出租车Waymo 的乘车费用高于 Uber 或 Lyft,但人们仍然愿意付费🔗

Obi(一个聚合实时定价和乘车服务的应用程序)的一份报告显示,Waymo的价格平均为20.43美元,而Lyft为14.44美元,Uber为15.58美元。 尽管价格更高,Waymo仍然很受欢迎,每周提供25万次付费行程。 调查显示,用户对无人驾驶出租车充满热情,但安全仍然是主要担忧。许多人希望有某种形式的远程人工监控。尽管多数受访者希望价格相同或更低,但也有相当一部分人愿意为Waymo的服务支付更高的价格,这可能是因为它提供了一种独特的、舒适的乘车体验。

Sean OKane

其他

本田成功发射和着陆实验性可重复使用火箭🔗

2025年6月17日,本田研发有限公司成功进行了实验性可重复使用火箭的发射和着陆测试。该火箭长6.3米,直径85厘米,干重900公斤,湿重1312公斤,由本田自主研发。这是本田首次在火箭达到近300米的高度后成功着陆。

本次测试旨在验证火箭重复使用所需的关键技术,例如上升和下降过程中的飞行稳定性以及着陆能力。测试中,火箭达到了271.4米的高度,着陆点距离目标地点37厘米,飞行时长为56.6秒,并收集了上升和下降过程中的数据。

本田官方视频

honda

为什么 SSL 在 90 年代末更名为 TLS (2014)🔗

在Netscape和微软的浏览器大战期间,Netscape开发了SSL协议,但最初版本存在缺陷。第一个生产版本是SSL 2,但它也有一些问题。微软为了参与竞争,基于SSL 2开发了PCT协议,仅在IE和IIS中支持。Netscape也想解决SSL 2的问题,但不想让微软主导标准,因此开发了SSL 3.0。为了避免协议分叉,作者所在的公司(Consensus Development)促成了Netscape和微软的会面,最终达成协议,由IETF接管协议并进行标准化。作为妥协,SSL 3.0需要进行一些修改(避免看起来像IETF直接认可Netscape的协议),并且需要更名。因此,TLS 1.0诞生了,它实际上是SSL 3.1。

Tim Dierks

Chris McCord

扫描二维码关注微信公众号