• python中的wordcloud库

    1. 核心功能 生成词云:将文本中的高频词以视觉化方式呈现,形成类似云状的彩色图片。 自定义形状:通过掩码图片生成特定形状的词云(如心形、圆形)。 颜色方案:支持多种颜色映射,或自定义颜色函数控制词云颜色。 停用词处理:内置停用词列表,可过滤无意义词汇(如“的”、“和”)。 2. 常用方法 创建词云对象: WordCloud(width=800, height=400, background_color='white'):配置词云尺寸、背景色等参数。 生成词云: generate(text):根据文本生成词云。 generate_from_frequencies(f...
  • python中的jieba库

    1. 核心功能 分词:支持精确模式、全模式、搜索引擎模式三种分词方式,适用于不同场景。 词性标注:为分词结果标注词性(如名词、动词),帮助理解词语在句子中的角色。 关键词提取:基于 TF-IDF 或 TextRank 算法提取文本关键词,快速获取文本核心信息。 自定义词典:允许用户添加自定义词汇,提高分词的准确性和灵活性。 2. 常用方法 分词方法: jieba.cut(text, cut_all=False):精确模式分词(默认),适合文本分析。 jieba.cut(text, cut_all=True):全模式分词,扫描所有可能的词语,适合信息检索。 jieba.cut_for_s...
  • python中的sklearn库

    1. 核心功能 机器学习算法:提供分类(如逻辑回归、决策树、SVM)、回归(如线性回归、随机森林)、聚类(如K-means、DBSCAN)、降维(如PCA)等多种算法。 数据预处理:支持数据清洗、特征缩放(标准化、归一化)、特征选择、缺失值处理等。 模型选择:提供交叉验证、网格搜索等工具,帮助选择合适的模型。 模型评估:支持准确率、精确率、召回率、ROC曲线等多种评估指标。 2. 常用类与方法 数据集加载: load_iris():加载鸢尾花数据集(分类任务)。 load_digits():加载手写数字数据集(分类任务)。 fetch_20newsgroups():加载新闻文本数据集...
  • python中的matplotlib库

    1. 核心功能 数据可视化:支持折线图、散点图、柱状图、饼图、3D 图等 20+ 种图表类型。 高度定制:可调整颜色、线型、标记、标签、标题、网格等样式。 跨平台输出:支持保存为 PNG、PDF、SVG 等格式,适配论文、网页、报告等场景。 2. 常用类与方法 pyplot 模块(类似 MATLAB 语法): 1234567891011121314import matplotlib.pyplot as plt# 绘制折线图plt.plot([1, 2, 3, 4], [10, 20, 25, 30], 'r--o', label='Line 1'...
  • python中的pandas库

    1. 核心功能 数据结构操作:提供 Series(一维)和 DataFrame(二维)数据结构,支持高效的数据操作。 数据清洗:集成处理缺失值、重复值、异常值等方法(如 dropna(), fillna(), drop_duplicates())。 数据分析:支持描述性统计、聚合、分组、排序、合并等操作(如 mean(), sum(), groupby(), sort_values(), merge())。 文件读写:支持 CSV、Excel、SQL、JSON 等格式的数据读写(如 read_csv(), to_excel())。 数据可视化:集成 Matplotlib 库,支持直接绘制...
  • python中的numpy库

    1. 核心功能 多维数组操作:提供高效的 ndarray 对象,支持向量、矩阵、高维数组运算。 数学函数集成:内置三角函数、指数函数、统计函数等,如 np.sin(), np.exp(), np.mean()。 线性代数:支持矩阵乘法、求逆、特征值计算等(通过 np.linalg 模块)。 随机数生成:提供均匀分布、正态分布等随机数生成函数(如 np.random.rand())。 文件读写:支持 CSV、二进制文件等数据格式的读写。 2. 常用类与方法 创建数组: 123456789101112import numpy as np# 从列表创建arr = np.array([1, 2...
  • python中的cv2库

    1. 核心功能 计算机视觉:支持图像处理、视频分析、特征提取、目标检测等任务。 跨平台:可在 Windows、Linux、macOS 等系统上运行。 算法丰富:提供 2500+ 优化算法,涵盖经典和先进的计算机视觉技术。 2. 常用类与方法 图像读取与显示: 12345678910import cv2# 读取图像(支持 JPG、PNG 等格式)img = cv2.imread("image.jpg", cv2.IMREAD_COLOR) # 彩色模式(默认)# img = cv2.imread("image.jpg", cv2.IMREAD_G...
  • python中的qrcode库

    1. 核心功能 生成二维码:将文本、网址等信息编码为二维码图片,支持自定义尺寸、颜色、容错率等。 依赖库:需配合 Pillow(PIL)库生成图像,安装时需使用 pip install qrcode[pil]。 2. 常用类与方法 QRCode 类: 初始化:123456qr = qrcode.QRCode( version=1, # 二维码尺寸(1-40),值越大尺寸越大 error_correction=qrcode.constants.ERROR_CORRECT_H, # 容错率(L/M/Q/H) box_size=10, ...
  • python中的tkinter库

    1. 核心功能 GUI 开发:用于创建桌面应用程序的图形界面,支持按钮、标签、文本框等组件。 跨平台:可在 Windows、Linux、macOS 等系统上运行。 事件驱动:通过绑定事件(如点击、按键)实现用户交互。 2. 常用类与方法 主窗口类 Tk(): root = tk.Tk():创建主窗口对象。 root.title("标题"):设置窗口标题。 root.geometry("宽x高"):设置窗口大小和位置。 root.mainloop():启动主事件循环,保持窗口运行。 常用组件: 标签 Label:12label = tk.L...
  • python中的turtle库

    1. 核心功能 绘图工具:通过控制“海龟”在屏幕上的移动绘制图形,适合编程初学者学习。 可视化编程:直观展示代码效果,帮助理解程序执行流程。 2. 常用类与方法 Turtle类(控制海龟): turtle.forward(d) / turtle.fd(d):向前移动 d 像素。 turtle.backward(d) / turtle.bk(d):向后移动 d 像素。 turtle.left(angle) / turtle.lt(angle):逆时针旋转 angle 度。 turtle.right(angle) / turtle.rt(angle...
1234