JavaScript基于ChatGPT API实现划词翻译浏览器脚本

2025-09-01 16:05:42

前言

最近 GitHub 上有个基于 ChatGPT API 的浏览器脚本，短时间内 star 冲到了 9.7k，功能上除了支持翻译外，还支持润色和总结功能，除了浏览器插件外，还使用了 tauri 打包了一个桌面客户端，那抛开 tauri 是使用 rust 部分，那浏览器部分实现还是比较简单的，今天我们就来手动实现一下。

openAI 提供的接口

比如我们可以复制以下代码，在浏览器控制台中发起请求，就可以完成翻译

//这是示例
const OPENAI_API_KEY = "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";

const prompt = `Translate this into Chinese:
        hello world`;
const res = await fetch("https://api.openai.com/v1/completions", {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    authorization: `Bearer ${OPENAI_API_KEY}`,
  },
  body: JSON.stringify({
    model: "text-davinci-003",
    prompt,
    max_tokens: 1000,
    temperature: 0,
  }),
});
const response = await res.json();

const result = response.choices[0].text;

上述代码中 OPONAI_API_KEY 需要替换成你自己的。

实现划词翻译

划词翻译是一种常见的网页功能，用户选择一个单词或一段文本时，自动弹出一个小窗口，显示该单词或文本的翻译。

1.首先，在 HTML 页面中添加一个空的 DIV 元素和一个触发翻译的按钮

let keyword;
const translation = document.createElement("div");
translation.id ="translation";
const icon = document.createElement("img");
icon.style.width ="30px";
icon.style.height = "30px";
icon.src ="http://example.com/icon.png";
translation.appendChild(icon)

2.为页面添加一个鼠标抬起事件监听器，当用户选择一段文本时，设置搜索关键词。

document.addEventListener("mouseup", (event) => {
  const selection = window.getSelection().toString().trim();
  if (selection) {
    keyword=selection；
  }
});

3.鼠标点击执行翻译逻辑。可以使用 AJAX 请求从后台获取翻译结果并将其显示在 DIV 元素中。

function translate(){
  if(keyword){
    // 执行翻译逻辑
  }
}
icon.addEventListener("mouseover", translate);

4.在 CSS 样式表中为 DIV 元素添加样式，使其浮动在页面上显示。

#translation {
  position: fixed;
  top: 10px;
  right: 10px;
  max-width: 300px;
  padding: 5px;
  background-color: #f7f7f7;
  border: 1px solid #ccc;
  box-shadow: 0px 2px 5px rgba(0, 0, 0, 0.1);
  z-index: 9999;
}

以上这些步骤就能实现划词翻译的基本功能，一起来看下效果。

react + antd 实现

上面的代码只是实现了一个最简单的版本，样式也不够美观，因此我们可以使用 webpack + react + antd 来实现一个现代化的插件，这里我使用一个之前创建的模版tampermonkey-starter。

使用 antd 的 Popover 组件来显示，使用 react 重构下js代码，我们就可以实现如下效果。

点击翻译按钮，就会通过接口请求，将翻译结果显示在下方。但是翻译结果需要等 api 完全返回，才会显示出来，这样会等待较慢，我们可以使用 Stream，OpenAI 的接口支持流渲染吗，这样结果就会一个字一个字蹦出来。

import { createParser } from "eventsource-parser";

const translate = async (text: string) => {
    const resp = await fetch("https://api.openai.com/v1/completions", {
      method: "POST",
      headers: {
        "Content-Type": "application/json",
        authorization:
          `Bearer ${OPENAI_API_KEY}`,
      },
      body: JSON.stringify({
        model: "text-davinci-003",
        prompt: `Translate this into Chinese:
          ${text}`,
        max_tokens: 1000,
        temperature: 0,
        frequency_penalty: 0,
        stream: true,
      }),
    });
    if (resp.status !== 200) {
      const res = await resp.json();
      setLoading(false);
      console.error(res);
      return;
    }
    const parser = createParser((event) => {
      if (event.type === "event") {
        const data = event.data;
        if (data === "[DONE]") {
          setLoading(false);
        }
        try {
          let json = JSON.parse(event.data);
          setResult((prev) => {
            return prev + json.choices[0].text;
          });
        } catch (error) {
          console.log(error);
        }
      }
    });
    const data = resp.body;
    if (!data) {
      console.log("Error: No data received from API");
      return;
    }
    const reader = resp.body.getReader();
    try {
      while (true) {
        const { done, value } = await reader.read();
        if (done) {
          setLoading(false);
          break;
        }
        const str = new TextDecoder().decode(value);
        parser.feed(str);
      }
    } finally {
      reader.releaseLock();
    }
  };

在上面代码中，我们使用 fetch API 发送了一个 HTTP 请求，并在响应中获取了一个可读流。我们可以使用 getReader 方法获取一个读取器对象，并使用它来处理流数据，使用了 eventsource-parser这个包来解析服务器推送（Server-sent events）的数据。

这样响应的内容就会根据Server-sent events（服务器发送的事件）逐个显示了。

文本转语音

一般翻译插件都有语音播放的功能，我们可以利用可以使用Web Speech API。此API提供了两个语音合成接口：SpeechSynthesis和SpeechSynthesisUtterance

function speak(text) {
  if ('speechSynthesis' in window) {
    const utterance = new SpeechSynthesisUtterance(text);
    utterance.voice = speechSynthesis.getVoices()[0];
    utterance.pitch = 1;
    utterance.rate = 1;
    speechSynthesis.speak(utterance);
  }
}

然后直接调用这个函数，传入需要朗读的文本，就可以实现语音播放

speak('Hello, world!');

小结

本文介绍了如何实现划词翻译的基本功能，包括使用 OpenAI 提供的接口进行翻译、在 HTML 页面中添加触发翻译的按钮和鼠标抬起事件监听事件、使用 AJAX 请求从接口获取翻译结果并将其显示在 DIV 元素中等。同时还介绍了如何使用 webpack + react + antd 实现一个现代化的插件，并利用 Web Speech API 实现语音播放功能。

以上就是JavaScript基于ChatGPT API实现划词翻译浏览器脚本的详细内容，更多关于JavaScript ChatGPT API现划词翻译浏览器的资料请关注我们其它相关文章！

LangChain简化ChatGPT工程复杂度使用详解

目录什么是LangChain? LangChain中的模块,每个模块如何使用? 具体代码什么是LangChain? 使用ChatGPT大家可能都是知道prompt, (1)想像一下,如果我需要快速读一本书,想通过本书作为prompt,使用ChatGPT根据书本中来回答问题,我们需要怎么做? (2)假设你需要一个问答任务用到prompt A,摘要任务要使用到prompt B,那如何管理这些prompt呢?因此需要用LangChain来管理这些prompt. LangChain的出现,简化了我们
详解如何利用chatgpt保护您的js代码

正文 ChatGPT是一个非常强大的自然语言处理模型,能够在多种应用场景下帮助人们更加高效地进行文本处理和语言交互.但是,由于其庞大的代码库和数据集,如果未经过适当的保护,可能会面临来自黑客和恶意用户的攻击. 为了保护ChatGPT的安全性,我们可以使用JavaScript混淆加密技术,这是一种将代码转换为难以理解的形式的技术.通过这种方式,黑客和攻击者将很难破解ChatGPT的代码,从而提高了其安全性. 使用JavaScript混淆加密下面是一个使用JavaScript混淆加密的代码案例:
html+css+js实现简易版ChatGPT聊天机器人

OpenAI的一款聊天机器人模型ChatGPT爆火,本篇文章用一百行html+css+js代码给大家制作一款简易的聊天机器人. <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1
详解微信小程序如何实现类似ChatGPT的流式传输

目录正文小程序上实现流失传输什么是流式传输? 为什么小程序不支持流式传输? 我的解决方案常规方案Axios 另辟蹊径:onChunkReceived方案后端接口配置正文最近指导群里小兄弟技术问题,发现一个让我也棘手的难题.于是激发了我潜意识精神力-干到底. 由于最近沉浸在chatgpt中,很久不用google和百度搜索东西了,正如我所料一般,他们也没有这方面的解决方案.于是,记录一下探索研究的过程,给各位水友一个分享扩展. 小程序上实现流失传输模拟ChatGPT的效果,实现流式传
ChatGPT用于OA聊天助手导致访问量服务宕机

目录闲谈开搞面临的问题聊天UI 服务端接口上线宕机优化问题处理流式传输 MD格式看看效果闲谈最近,火到不行的明星团队产品 ChatGPT,热度一度非常高,付费用户都开始通过邀请制,专属登陆链接来限制流量了.开了Plus以后返回内容和速度真是10倍速啊~ 但对于小白或普通用户(也可能非技术行业的大佬),想要访问和体验还是挺麻烦的.除了准备梯子.接码.账号以外还可能遇到节点或网络,多次连接失败的问题. 所以,本着能折腾绝对不休息的原则,2天搞了一个聊天助手,凭借其语义的理解,关联
ChatGPT前端编程秀之别拿编程语言不当语言

目录 TDD第一步就卡住了破门而入,针对性反馈总结一下 TDD第一步就卡住了写完小工具,这一篇回来我们接着写我们的程序.再看一眼我们的程序运行视图: 带着TDD思路,我进入了 ejs_and_yaml_dsl_loader 这个模块,这块因为我切的不是很好,所以这代码有点难写,不过没关系,正好我们实际工作大部分的场景都是这样的.看看我们在这里能玩出点什么来. 那么这次的需求呢是这个样子的,我们需要把ejs模版引擎渲染出的yaml转换为json,那么我们这个功能会非常复杂,所以我们没有以上来
两天没解决的问题chatgpt用了5秒搞定隐藏bug

目录前言隐藏的“间谍” code 验证第一位”间谍“ 借助GPT“侦探柯南” 找出"真凶" AI已来,未来已来前言一个说难不难,说简单竟看不出来是哪里问题的一个bug.是的可能自己能力和经验尚浅无法识别,下面你们能否用火眼金睛一眼让bug原形毕露 (这个问题是忽然暴露出来的,无任何征兆,没人改动过,生产上运行了很长时间,故很奇怪,所以这个间谍看来很会隐藏) 隐藏的“间谍” 下面先来看代码(伪代码) code /** * 两个从数据库查询的耗时任务 * @param count
让chatGPT教你如何使用taro创建mbox

目录 @tarojs/mobx如何使用useLocalstory创建实例这样其他组件或页面能获取到数据变更吗? 那在函数式组件中如何使用inject @tarojs/mobx如何使用useLocalstory创建实例 @tarojs/mobx 是 Taro 框架的 MobX 实现,提供了 useLocalStore hook 用于在函数组件中创建 MobX store. 要使用 useLocalStore 创建实例,需要先定义一个 MobX store 类.例如,下面是一个简单的计数器示例:
一文解析ChatGPT 之 Fetch 请求

目录 SSE 介绍咋和 ChatGPT 控制台看到的内容不一样?
python实现划词翻译

最近因为编程,需要大量地看一些说明文档,无奈说明文档都是英文的,可把我这个半桶水折腾死了,太多词汇不知道,一个个复制翻译太麻烦了.于是我根据自己的需要,用python写了一个划词翻译. 一.使用逻辑由于我是看PDF文档,用的是一款轻量级的PDF阅读器(SumatraPDF),这款阅读器只有5M,但是阅读很舒服很流畅,渲染也很到位.但是没有其他阅读器有许多强大功能,比如说划词翻译. 我的想法是一旦发现我复制就可以在当前鼠标位置显示一个翻译结果框.基于这个想法,我一开始准备使用MFC编写,因为MF
基于jquery的页面划词搜索JS

基于Jquery修改,以下为全部脚本复制代码代码如下: //划词搜索 var GLS = {}; GLS.startObj = null; GLS.isdb = false; GLS.allow = true; GLS.isallow = function() { if (GLS.allow) { GLS.allow = false; alert('Google搜索已关闭'); } else { GLS.allow = true; alert('Google搜索已打开'); } }; GLS
一文带你了解ChatGPT API的使用

目录 1.概述 2.内容 2.1 ChatGPT优点 2.2 ChatGPT的应用场景 2.3 ChatGPT的发展前景 3.API应用 4.API代码实现 4.1 Python实现 4.2 JavaScript实现 4.3 Java实现 4.4 智能对话简易实现 5.总结 1.数据准备 2.模型训练 3.对话生成 4.模型评估 1.概述随着人工智能技术的不断发展,越来越多的AI产品被应用到各个领域,其中最具代表性的莫过于人工智能语言模型.语言模型是一种可以通过学习大量语言数据来预测文本或语音
利用Python通过获取剪切板数据实现百度划词搜索功能

一.实现划词功能说是划词翻译,实际上我们是通过获取用户的剪切板内容,通过一系列的操作得到的.首先呢,我们就先实现如何获取剪切板内容的程序首先先在桌面创建一个文件夹,命名为"MoveSearch"文件夹之后我们双击点入这个文件夹,创建一个"MainWindow.py"的程序和"Clipborad.py"这两个程序我们这里使用Sublime进行操作演示,我们点开"ClipBoard.py"的文件,然后我们按照下面的图片添加
javascript 页面划词搜索JS

基于Jquery修改,以下为全部脚本复制代码代码如下: //划词搜索 var GLS = {}; GLS.startObj = null; GLS.isdb = false; GLS.allow = true; GLS.isallow = function() { if (GLS.allow) { GLS.allow = false; alert('Google搜索已关闭'); } else { GLS.allow = true; alert('Google搜索已打开'); } }; GLS
javascript实现划词标记+划词搜索功能

复制代码代码如下: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html> <head> <title>Untitled Document</title> <meta http-equiv="Content-Type" content="text/html; charset=gb2312"
基于jquery的划词搜索实现（备忘）

参照页面:http://www.jb51.net/article/24825.htm 一.DragSearchByJQuery.aspx页面(调用页面) 复制代码代码如下: <head runat="server"> <title>划词搜索</title> <style type="text/css"> /*search*/ a.GL_s{width:68px;height:20px;display:block;bo
javascript 实现划词标记划词搜索功能

javascript实现划词标记划词搜索功能 0) { str=oText.text; oText.text="BuB"+oText.text+"EuE"; } oText.select(); event.srcElement.innerHTML=event.srcElement.innerHTML.replace("BuB","").replace("EuE",""); } searc
详解实现一个通用的“划词高亮”在线笔记功能

1. 什么是"划词高亮"? 有些同学可能不太清楚"划词高亮"是指什么,下面就是一个典型的"划词高亮": 上图的示例网站可以点击这里访问.用户选择一段文本(即划词),即会自动将这段选取的文本添加高亮背景,用户可以很方便地为网页添加在线笔记. 笔者前段时间为线上业务实现了一个与内容结构非耦合的文本高亮笔记功能.非耦合是指不需要为高亮功能建立特殊的页面 DOM 结构,而高亮功能对业务近乎透明.该功能核心部分具有较强的通用性与移植性,故拿出来和大家分享交
JavaScript基于replace+正则实现ES6的字符串模版功能

本文实例讲述了JavaScript基于replace+正则实现ES6的字符串模版功能.分享给大家供大家参考,具体如下: 采用拼接字符串的形式,将 JSON 数据嵌入 HTML 中.开始时代码量较少,暂时还可以接受.但当页面结构复杂起来后,其弱点开始变得无法忍受起来: 书写不连贯.每写一个变量就要断一下,插入一个 + 和 ".十分容易出错. 无法重用.HTML 片段都是离散化的数据,难以对其中重复的部分进行提取. 无法很好地利用标签.这是 HTML5 中新增的一个标签,标准极力推荐将 HTML

JavaScript基于ChatGPT API实现划词翻译浏览器脚本

目录

前言

openAI 提供的接口

实现划词翻译

react + antd 实现

文本转语音

小结

相关推荐

随机推荐