分类 工作 下的文章

1.在浏览器输入:https://www.deepseek.com/,点击接入API




2.刚开始进去就送500万tokens(约为10元钱的额度),在2025年2月8日前都有优惠




3.点击API keys,创建API key,J记得创建时截一张图,免得又要创建






3.项目对API key的使用方法


首先在pycharm中pip install openai




然后,创建一个client(我这里命名为init_openai)




并单独创建一个.env文件保存你刚刚创建的API key(也可以直接放在init_openai这里,如果你不怕被别人看见的话),




再封装好deepseek的接口




4.模型参数可根据任务需求进行修改





5.其token用量的计算



————————————————


                            版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

                        

原文链接:https://blog.csdn.net/qq_64296768/article/details/145113707


我胡汉三回来了,最近一直没更新是因为事太多



今天遇到的小问题,想把云服务器放到移动硬盘里随时随地用,但是制作镜像的时候懵了

我的服务器是轻量级云服务器(当时图便宜买的)


很明显我这里是点了共享的


但是共享镜像里没有 我是百思不得其解


后来咨询了了一下,是轻量级服务器没法直接导出

需要先共享到云服务器,这就能说得通为什么轻量级服务器那个界面没有共享镜像,反而出现在了云服务器这个界面了

✨共享只是第一步,这一步后云服务器的共享镜像中会显示刚才选择共享的镜像,现在自定义镜像这里还没有他,下一步点击同地域复制,把云服务器这个界面的共享镜像放到自定义镜像中

这个过程需要等一会


✨这里导出镜像到存储桶(如果之前没有用过存储桶,这里要自己授权一下,基本都是无脑同意即可,不过多介绍)


✨导出镜像这个过程要等,具体取决于个人网络(10-30分钟)



✨下载即可


后续安装使用可参考这位佬的博客:http://t.csdn.cn/Zlzep


ps:下载可能会用到COSbrowser,不用怕只是个下载器,可以把它理解为以前那个QQ旋风



✨参考文档+总结:

1.将轻量应用服务器镜像共享至云服务器,可参考轻量应用服务器镜像共享。

https://cloud.tencent.com/document/product/1207/63264

2.在云服务器中,通过共享镜像-同地域复制将镜像复制到自定义镜像。

https://cloud.tencent.com/document/product/213/4943#.E5.85.B1.E4.BA.AB.E9.95.9C.E5.83.8F-.E5.90.8C.E5.9C.B0.E5.9F.9F.E5.A4.8D.E5.88.B6

3.将自定义镜像导出至COS存储桶内,可参考将已创建的自定义镜像导出至对象存储 COS 的存储桶内。

https://cloud.tencent.com/document/product/213/70518

4.最后,从COS存储桶中下载镜像至本地即可。


最近运气有点背,干啥啥是bug,不过基本都解决了,加油。


————————————————


                            版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

                        

原文链接:https://blog.csdn.net/m0_53889456/article/details/132804105


现在最火的AI模型是什么?当之无愧的肯定是DeepSeek,我今天也来凑这个热闹。废话不多说直接上干货!!

如果是NAS就在 Docker 镜像里直接搜索dyrnq/open-webui这个 Open WebUI 的镜像运行。

如果使用的是其他设备的Docker就直接用docker命令拉取(当然NAS也可以),我用的端口是3889

docker run -d -p 3889:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always dyrnq/open-webui:main

大厂的 API 基本都是注册就送 50 万、100 万,个人使用足够:

注册就不说了,我拿我现在用的火山方舟来做示例

创建API,把API复制到记事本,后面要用到

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

在线推理选择deepseek

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

然后就可以调用API了,三个参数分别是

  • API Key:复制出来的 API Key

  • 模型:看下面的截图

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

回到OpenWebUI然后填写相关参数,左下角或者右下角点击管理员面板

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

点设置-外部链接,填写URL和API KEY

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

然后点击旁边的设置按钮添加模型

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

添加完模型以后一定要点击+号然后再点击保存,否则保存不了模型。

现在就可以愉快的聊天了

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

如果你需要添加火山方舟的其他模型只需要在模型里添加相应的模型名称就可以了,比如我又添加了一个豆包的

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

如果添加其他的提供商是同样的方法,硅基流动的模型可以为空,会自动把所有模型都添加上去。

模型如果添加多了都不知道哪个名称对应的是哪个,我们就需要修改一下名称让我们知道它是哪个模型

同样在管理面板的设置里找到模型,点击模型名称并修改,然后保存并更新

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

修改完成后

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

如果要添加联网搜索就在管理面板里把联网搜索打开,duckduckgo是不需要api的,tavily方法也比较简单,注册送1000次搜索,其他自行摸索

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

保存后就可以联网搜索了

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

如果想要开启官网一样的思考模式那就需要导入函数了

首先打开链接注册一个账号:https://openwebui.com/f/zgccrui/deepseek_r1

点击Get

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

填写内网或者外网的访问Open WebUI的地址

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

点击Import to WebUI然后点保存,确认

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

保存好后在页面的设置里填写URL API KEY和模型名称,然后保存

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

保存好以后修改一下带推理模型的名称,然后就可以问问题了

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

测试一下六年级奥数题目

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

思考中

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

答案正确,我们可以清晰的看到推理过程

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

如果需要火山方舟自己的联网搜索并且带推理模式那就需要在控制台设置一下

打开在线推理-关联应用-立即创建

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

选择零代码

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

选择单聊模式

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

内容看着填

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

开通好以后打开联网,然后点发布

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

到这里就需要需改一下URL地址和模型名称了,这里可以很清楚的看到URL

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

后面带bot的这个就是URL地址

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

模型名称在这里

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

我们在函数里面修改URL和模型名称

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

修改一下模型名称,这样就可以使用火山方舟的联网+推理了

Docker安装 Open WebUI,调用API使用满血 DeepSeek R1+推理+联网

同样的道理,火山方舟支持的其他模型也可以这么去操作


一、ollama 与 docker 简介

(一)ollama(Ollama)

ollama 是一个强大的工具,它为模型的管理和运行提供了便利。它可以简化模型的下载、配置和启动过程,让用户能够快速地将不同的模型集成到自己的工作流程中。例如,在处理多个不同类型的大语言模型时,ollama 可以轻松管理这些模型之间的切换和调用,提高开发效率。

(二)docker

docker 则是容器化技术的代表,它能够将应用程序及其依赖项打包成一个独立的容器。在 DeepSeek 部署中,使用 docker 可以确保 deepseek - r1 在不同环境中具有一致的运行状态。无论在开发环境、测试环境还是生产环境,只要安装了 docker,就可以运行相同的 deepseek - r1 容器,避免了因环境差异导致的兼容性问题。

二、利用 ollama 和 docker 配置 deepseek-r1 的准备工作

(一)硬件需求

同常规的 DeepSeek 部署类似,需要一台性能不错的计算机。内存建议 16GB 以上,这样在运行容器和模型时,能够保证系统的流畅性。同时,配备 NVIDIA GPU 会显著提升模型的推理速度,对于处理大规模文本任务非常关键。

(二)软件安装

安装 docker:可以从 docker 官方网站获取适合你操作系统的安装包,按照官方指引进行安装。在安装完成后,确保 docker 服务正常运行,可通过简单的命令行测试来验证(sheel中输入docker)

安装 ollama:根据你使用的操作系统,选择合适的安装方式。例如,在 Linux 系统中,可以通过特定的脚本进行安装。安装完成后,配置好 ollama 的运行环境变量,确保其能够被系统正确识别。

三、配置 deepseek-r1 的详细步骤

图片

可以看出DeepSeek-r1完全模型在各方面优于OpenAI,在某些方面评估甚至强于OpenAI,参数量适合于本地部署办公使用。

(一)使用 ollama 获取 deepseek-r1 模型

通过 ollama 的命令行工具,输入特定的命令来搜索和下载 deepseek - r1 模型。ollama 会自动从官方或指定的源获取模型文件,并将其存储在本地的模型库中。

(二)利用 docker 创建 deepseek-r1 容器

基于下载好的 deepseek - r1 模型,使用 docker 命令创建一个新的容器。在创建容器时,需要指定容器的名称、挂载的目录(以便与本地文件系统进行交互)以及容器运行所需的环境变量。

查看模型列表

可以访问 ollama 官方的模型仓库library查看支持的模型列表,点击浏览某个模型,可看到详细说明,如模型参数、大小、运行命令等信息。

下载模型命令

使用ollama pull命令进行下载。例如,若要下载图片中的deepseek - r1 7b 模型,在命令行中输入


ollama pull deepseek-r1:7b

(若不指定具体版本如 7b 等,默认下载最新版本)。首次使用该命令运行模型时,ollama 也会自动从网上下载模型。

注意事项

下载速度可能受网络状况影响,如果网络不稳定,下载模型可能需要较长等待时间。

部分模型对硬件资源有一定要求,如运行较大的模型(像 llama3 - 70b)可能会较慢,甚至出现硬件资源不足无法正常运行的情况,下载前可了解模型对硬件的需求。(主要是系统内存的要求)

配置容器的网络设置,确保容器能够与外部进行通信。可以根据实际需求,设置容器的端口映射,使本地应用能够访问到容器内运行的 deepseek - r1 服务。

(三)启动和测试 deepseek-r1 服务

完成容器创建后,使用 docker 命令启动 deepseek - r1 容器。容器启动后,ollama 会自动加载 deepseek - r1 模型,并启动相关的服务进程。

通过编写简单的测试脚本,向运行在容器内的 deepseek - r1 服务发送请求,验证模型是否正常工作。例如,可以发送一段文本,请求模型生成回答,检查返回的结果是否符合预期。

(四)WebUi的配置

搭建部署 Open WebUI 的方式

Docker方式(官网推荐)

Open WenUI 官网:GitHub - open-webui/open-webui: User-friendly AI Interface (Supports Ollama, OpenAI API, ...)

图片


docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v D:devopen-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

此命令启动一个docker容器









docker run:这是 Docker 用于运行容器的基本命令,它会根据指定的镜像创建并启动一个新的容器实例。-d:表示以守护进程(detached)模式运行容器,即容器会在后台运行,不会占用当前命令行终端的输入输出流,方便执行其他命令。-p 3000:8080:端口映射参数,将容器内部的 8080 端口映射到主机的 3000 端口。这样,通过访问主机的 3000 端口,就可以访问到容器内运行在 8080 端口上的open-webui应用。--add-host=host.docker.internal:host-gateway:此参数用于向容器内的/etc/hosts文件中添加一条主机映射记录,将host.docker.internal映射到host-gateway。这在容器需要与主机进行通信时非常有用,特别是在一些特殊网络环境下,使得容器能够通过host.docker.internal这个域名访问到主机。-v D:devopen-webui:/app/backend/data:这是卷挂载(volume mount)参数,将主机上的D:devopen-webui目录挂载到容器内的/app/backend/data目录。这意味着主机和容器可以共享这个目录下的文件,主机目录中的任何更改都会实时反映到容器内,反之亦然。常用于数据持久化或在容器和主机之间传递数据。--name open-webui:为运行的容器指定一个名称为open-webui,方便后续对容器进行管理和操作,例如使用docker stop open-webui停止容器,或docker start open-webui启动容器。--restart always:表示无论容器因为何种原因停止,Docker 都会自动尝试重新启动它,确保容器始终处于运行状态。ghcr.io/open-webui/open-webui:main:这是容器所使用的镜像名称和标签,指定从 GitHub Container Registry(ghcr.io)上拉取open-webui/open-webui镜像的main版本。如果本地没有该镜像,Docker 会自动从指定的镜像仓库下载。

启动ollama容器

1.使用该命令启动CPU版运行本地AI模型


docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

2.此命令用于启动GPU版本运行AI模型

前提是笔记本已配置NVIDIA的GPU驱动,可在shell中输入nvidia-smi查看详细情况


docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

图片

然后就可以访问docker中给出的open webui的地址启动web界面,选择好模型就可以进行问答对话了,恭喜你拥有了自己的AI小助手!

四、这种配置方式的优势

(一)快速部署

ollama 和 docker 的结合,大大缩短了 deepseek - r1 的部署时间。通过简单的命令行操作,即可完成模型的获取和容器的创建,相比传统的手动配置方式,效率得到了极大提升。

(二)环境隔离

docker 的容器化技术实现了环境的隔离,使得 deepseek - r1 在独立的环境中运行,不会受到本地系统其他软件的干扰。同时,也方便对模型进行版本管理和维护,当需要更新或切换模型版本时,只需要重新创建或更新容器即可。

(三)易于扩展

在后续的应用中,如果需要增加模型的计算资源,或者部署多个 deepseek - r1 实例,可以轻松地通过 docker 的集群管理功能进行扩展。ollama 也能够方便地管理多个模型之间的协同工作,满足不同业务场景的需求。

五、可能遇到的问题及解决方法

(一)网络问题

在下载模型或容器通信过程中,可能会遇到网络不稳定的情况。解决方法是检查网络连接,尝试更换网络环境或使用代理服务器。同时,ollama 和 docker 都提供了相关的网络配置选项,可以根据实际情况进行调整。

(二)资源冲突

当本地系统中已经运行了其他占用端口或资源的服务时,可能会与 deepseek - r1 容器产生冲突。可以通过修改容器的端口映射或调整本地服务的配置,来避免资源冲突。

利用 ollama 和 docker 配置 deepseek - r1 实现 DeepSeek 本机部署,为我们提供了一种高效、便捷且稳定的部署方式。随着人工智能技术的不断发展,这种基于容器化和模型管理工具的部署方法,将在更多的应用场景中发挥重要作用,推动大语言模型技术在本地开发和应用中的普及。


proxmox ve resize guest disk

第一步

通过web ui中调整磁盘大小功能,先设置分配给虚拟机的磁盘空间,如下图

 

 我这里是从105G,调整到205个G

第二步

进入虚拟机系统,我这里的系统是CentOS,其他Linux系统应该类似。

查看磁盘信息,可以看到磁盘的总大小已经变化了,但是下边两个分区没有变

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
[root@localhost ~]# fdisk -l
 
磁盘 /dev/sda:220.1 GB, 220117073920 字节,429916160 个扇区
Units = 扇区 of 1 * 512 = 512 bytes
扇区大小(逻辑/物理):512 字节 / 512 字节
I/O 大小(最小/最佳):512 字节 / 512 字节
磁盘标签类型:dos
磁盘标识符:0x000c264f
 
   设备 Boot      Start         End      Blocks   Id  System
/dev/sda1   *        2048     2099199     1048576   83  Linux
/dev/sda2         2099200   220200959   109050880   8e  Linux LVM
 
磁盘 /dev/mapper/centos-root:109.5 GB, 109517471744 字节,213901312 个扇区
Units = 扇区 of 1 * 512 = 512 bytes
扇区大小(逻辑/物理):512 字节 / 512 字节
I/O 大小(最小/最佳):512 字节 / 512 字节
 
磁盘 /dev/mapper/centos-swap:2147 MB, 2147483648 字节,4194304 个扇区
Units = 扇区 of 1 * 512 = 512 bytes
扇区大小(逻辑/物理):512 字节 / 512 字节
I/O 大小(最小/最佳):512 字节 / 512 字节

  

第三步

给 /dev/sda2分区增加空间,注意里边的命令 resizepart 2 100% ,是把剩余的空间全部给到/dev/sda2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
[root@localhost ~]# parted /dev/sda
GNU Parted 3.1
使用 /dev/sda
Welcome to GNU Parted! Type 'help' to view a list of commands.
(parted) print
Model: ATA QEMU HARDDISK (scsi)
Disk /dev/sda: 220GB
Sector size (logical/physical): 512B/512B
Partition Table: msdos
Disk Flags:
 
Number  Start   End     Size    Type     File system  标志
 1      1049kB  1075MB  1074MB  primary  xfs          启动
 2      1075MB  113GB   112GB   primary               lvm
 
(parted) resizepart 2 100%
(parted) quit
信息: You may need to update /etc/fstab.

  

接下来你就可以看到/dev/sda2分区的大小已经变化,看End值

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
[root@localhost ~]# fdisk -l
 
磁盘 /dev/sda:220.1 GB, 220117073920 字节,429916160 个扇区
Units = 扇区 of 1 * 512 = 512 bytes
扇区大小(逻辑/物理):512 字节 / 512 字节
I/O 大小(最小/最佳):512 字节 / 512 字节
磁盘标签类型:dos
磁盘标识符:0x000c264f
 
   设备 Boot      Start         End      Blocks   Id  System
/dev/sda1   *        2048     2099199     1048576   83  Linux
/dev/sda2         2099200   429916159   213908480   8e  Linux LVM
 
磁盘 /dev/mapper/centos-root:109.5 GB, 109517471744 字节,213901312 个扇区
Units = 扇区 of 1 * 512 = 512 bytes
扇区大小(逻辑/物理):512 字节 / 512 字节
I/O 大小(最小/最佳):512 字节 / 512 字节
 
 
磁盘 /dev/mapper/centos-swap:2147 MB, 2147483648 字节,4194304 个扇区
Units = 扇区 of 1 * 512 = 512 bytes
扇区大小(逻辑/物理):512 字节 / 512 字节
I/O 大小(最小/最佳):512 字节 / 512 字节

第四步

更新物理卷的大小,当然这里前提是使用了LVM

1
pvresize /dev/sda2

 接下来更新逻辑卷的大小

1
2
3
4
5
6
7
8
9
10
11
12
13
[root@localhost ~]# lvresize --extents +100%FREE --resizefs /dev/mapper/centos-root
  Size of logical volume centos/root changed from <102.00 GiB (26111 extents) to <202.00 GiB (51711 extents).
  Logical volume centos/root successfully resized.
meta-data=/dev/mapper/centos-root isize=512    agcount=15, agsize=1900032 blks
         =                       sectsz=512   attr=2, projid32bit=1
         =                       crc=1        finobt=0 spinodes=0
data     =                       bsize=4096   blocks=26737664, imaxpct=25
         =                       sunit=0      swidth=0 blks
naming   =version 2              bsize=4096   ascii-ci=0 ftype=1
log      =internal               bsize=4096   blocks=3711, version=2
         =                       sectsz=512   sunit=0 blks, lazy-count=1
realtime =none                   extsz=4096   blocks=0, rtextents=0
data blocks changed from 26737664 to 52952064

   最后可以看到已经成功了

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
[root@localhost ~]# fdisk -l
 
磁盘 /dev/sda:220.1 GB, 220117073920 字节,429916160 个扇区
Units = 扇区 of 1 * 512 = 512 bytes
扇区大小(逻辑/物理):512 字节 / 512 字节
I/O 大小(最小/最佳):512 字节 / 512 字节
磁盘标签类型:dos
磁盘标识符:0x000c264f
 
   设备 Boot      Start         End      Blocks   Id  System
/dev/sda1   *        2048     2099199     1048576   83  Linux
/dev/sda2         2099200   429916159   213908480   8e  Linux LVM
 
磁盘 /dev/mapper/centos-root:216.9 GB, 216891654144 字节,423616512 个扇区
Units = 扇区 of 1 * 512 = 512 bytes
扇区大小(逻辑/物理):512 字节 / 512 字节
I/O 大小(最小/最佳):512 字节 / 512 字节
 
 
磁盘 /dev/mapper/centos-swap:2147 MB, 2147483648 字节,4194304 个扇区
Units = 扇区 of 1 * 512 = 512 bytes
扇区大小(逻辑/物理):512 字节 / 512 字节
I/O 大小(最小/最佳):512 字节 / 512 字节
 
 
 
 
[root@localhost ~]# df -h
文件系统                 容量  已用  可用 已用% 挂载点
devtmpfs                 908M     0  908M    0% /dev
tmpfs                    919M     0  919M    0% /dev/shm
tmpfs                    919M  8.6M  911M    1% /run
tmpfs                    919M     0  919M    0% /sys/fs/cgroup
/dev/mapper/centos-root  202G   93G  110G   46% /
/dev/sda1               1014M  282M  733M   28% /boot
tmpfs                    184M     0  184M    0% /run/user/0

  

如果你是非lvm,可以尝试下边的命令,不过我没测试过

1
resize2fs /dev/sda2