1. 核心功能
生成词云:将文本中的高频词以视觉化方式呈现,形成类似云状的彩色图片。
自定义形状:通过掩码图片生成特定形状的词云(如心形、圆形)。
颜色方案:支持多种颜色映射,或自定义颜色函数控制词云颜色。
停用词处理:内置停用词列表,可过滤无意义词汇(如“的”、“和”)。
2. 常用方法
创建词云对象:
WordCloud(width=800, height=400, background_color='white'):配置词云尺寸、背景色等参数。
生成词云:
generate(text):根据文本生成词云。
generate_from_frequencies(f...
1. 核心功能
分词:支持精确模式、全模式、搜索引擎模式三种分词方式,适用于不同场景。
词性标注:为分词结果标注词性(如名词、动词),帮助理解词语在句子中的角色。
关键词提取:基于 TF-IDF 或 TextRank 算法提取文本关键词,快速获取文本核心信息。
自定义词典:允许用户添加自定义词汇,提高分词的准确性和灵活性。
2. 常用方法
分词方法:
jieba.cut(text, cut_all=False):精确模式分词(默认),适合文本分析。
jieba.cut(text, cut_all=True):全模式分词,扫描所有可能的词语,适合信息检索。
jieba.cut_for_s...
1. 核心功能
机器学习算法:提供分类(如逻辑回归、决策树、SVM)、回归(如线性回归、随机森林)、聚类(如K-means、DBSCAN)、降维(如PCA)等多种算法。
数据预处理:支持数据清洗、特征缩放(标准化、归一化)、特征选择、缺失值处理等。
模型选择:提供交叉验证、网格搜索等工具,帮助选择合适的模型。
模型评估:支持准确率、精确率、召回率、ROC曲线等多种评估指标。
2. 常用类与方法
数据集加载:
load_iris():加载鸢尾花数据集(分类任务)。
load_digits():加载手写数字数据集(分类任务)。
fetch_20newsgroups():加载新闻文本数据集...
1. 核心功能
数据可视化:支持折线图、散点图、柱状图、饼图、3D 图等 20+ 种图表类型。
高度定制:可调整颜色、线型、标记、标签、标题、网格等样式。
跨平台输出:支持保存为 PNG、PDF、SVG 等格式,适配论文、网页、报告等场景。
2. 常用类与方法
pyplot 模块(类似 MATLAB 语法):
1234567891011121314import matplotlib.pyplot as plt# 绘制折线图plt.plot([1, 2, 3, 4], [10, 20, 25, 30], 'r--o', label='Line 1'...
1. 核心功能
数据结构操作:提供 Series(一维)和 DataFrame(二维)数据结构,支持高效的数据操作。
数据清洗:集成处理缺失值、重复值、异常值等方法(如 dropna(), fillna(), drop_duplicates())。
数据分析:支持描述性统计、聚合、分组、排序、合并等操作(如 mean(), sum(), groupby(), sort_values(), merge())。
文件读写:支持 CSV、Excel、SQL、JSON 等格式的数据读写(如 read_csv(), to_excel())。
数据可视化:集成 Matplotlib 库,支持直接绘制...
1. 核心功能
多维数组操作:提供高效的 ndarray 对象,支持向量、矩阵、高维数组运算。
数学函数集成:内置三角函数、指数函数、统计函数等,如 np.sin(), np.exp(), np.mean()。
线性代数:支持矩阵乘法、求逆、特征值计算等(通过 np.linalg 模块)。
随机数生成:提供均匀分布、正态分布等随机数生成函数(如 np.random.rand())。
文件读写:支持 CSV、二进制文件等数据格式的读写。
2. 常用类与方法
创建数组:
123456789101112import numpy as np# 从列表创建arr = np.array([1, 2...
1. 核心功能
计算机视觉:支持图像处理、视频分析、特征提取、目标检测等任务。
跨平台:可在 Windows、Linux、macOS 等系统上运行。
算法丰富:提供 2500+ 优化算法,涵盖经典和先进的计算机视觉技术。
2. 常用类与方法
图像读取与显示:
12345678910import cv2# 读取图像(支持 JPG、PNG 等格式)img = cv2.imread("image.jpg", cv2.IMREAD_COLOR) # 彩色模式(默认)# img = cv2.imread("image.jpg", cv2.IMREAD_G...
1. 核心功能
生成二维码:将文本、网址等信息编码为二维码图片,支持自定义尺寸、颜色、容错率等。
依赖库:需配合 Pillow(PIL)库生成图像,安装时需使用 pip install qrcode[pil]。
2. 常用类与方法
QRCode 类:
初始化:123456qr = qrcode.QRCode( version=1, # 二维码尺寸(1-40),值越大尺寸越大 error_correction=qrcode.constants.ERROR_CORRECT_H, # 容错率(L/M/Q/H) box_size=10, ...
1. 核心功能
GUI 开发:用于创建桌面应用程序的图形界面,支持按钮、标签、文本框等组件。
跨平台:可在 Windows、Linux、macOS 等系统上运行。
事件驱动:通过绑定事件(如点击、按键)实现用户交互。
2. 常用类与方法
主窗口类 Tk():
root = tk.Tk():创建主窗口对象。
root.title("标题"):设置窗口标题。
root.geometry("宽x高"):设置窗口大小和位置。
root.mainloop():启动主事件循环,保持窗口运行。
常用组件:
标签 Label:12label = tk.L...
1. 核心功能
绘图工具:通过控制“海龟”在屏幕上的移动绘制图形,适合编程初学者学习。
可视化编程:直观展示代码效果,帮助理解程序执行流程。
2. 常用类与方法
Turtle类(控制海龟):
turtle.forward(d) / turtle.fd(d):向前移动 d 像素。
turtle.backward(d) / turtle.bk(d):向后移动 d 像素。
turtle.left(angle) / turtle.lt(angle):逆时针旋转 angle 度。
turtle.right(angle) / turtle.rt(angle...