【Autoregressive】从0构造一个基于Paddle的自回归模型库


本文展示基于Paddle构建自回归模型库PaddleAutoregressive的过程。先介绍自回归模型原理,说明其本质为线性模型组合。接着展示基础模块Autoregressive类的搭建,以此封装出AR模型,还介绍了数据读取、模型训练与预测的实现。最后说明将代码封装为库的方法,方便用户通过源码下载、PIP安装和导入使用。项目会持续更新,欢迎交流。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

【autoregressive】从0构造一个基于paddle的自回归模型库 -

PaddleAutoregressive 从0构造一个基于Paddle的自回归模型库

自回归是一个传统的时间序列方法,已经有很多开源框架集成提供了对应的使用方法。为了更加便利地使用Paddle进行开发,本项目目的是开发一个基于Paddle的自回归时间序列库。

关于Autoregressive

参考百度百科:“自回归模型(英语:Autoregressive model,简称AR模型),是统计上一种处理时间序列的方法,用同一变数例如x的之前各期,亦即x1至xt-1来预测本期xt的表现,并假设它们为一线性关系。因为这是从回归分析中的线性回归发展而来,只是不用x预测y,而是用x预测 x(自己);所以叫做自回归”。

简单来说,自回归模型本质是一种线性模型,即paddle.nn.Linear。迄今为止,自回归模型已经有很多派生,比如ARX、ARMA、ARARX等等,但这些模型仍然可以通过对Lienar进行组合实现。

关于本项目

本项目并非一个库的推广,而是构造一个库的过程的展示。整个内容会比较粗浅,欢迎大家一起学习交流。

PaddleAutoregressive会随着时间(我闲的没事的时候)而不断更新,维护地址为:https://github.com/Liyulingyue/PaddleAutoregressive,如果大家感兴趣欢迎前往提ISSUR或PR。也可以直接在本项目下评论~

内容介绍

本次介绍的内容如下:

  • 网络 Autoregressive
  • AR模型的实现与训练
  • 封装为库(Setup.py的攥写),通过这种方式可以简单的让大家通过“下载源码 - PIP - import”的方式使用代码

自回归模型

参考知乎页面,几个自回归模型的可以看做满足以下格式:

A(p)y(k)=B(q)u(k)+C(o)v(k)A(p)y(k)=B(q)u(k)+C(o)v(k)

其中:

  • A(p)y(k)=y(k)+a1y(k1)+a2y(k2)+...+apy(kp)A(p)y(k)=y(k)+a1y(k−1)+a2y(k−2)+...+apy(k−p),B(q)u(k)B(q)u(k)和C(o)v(k)C(o)v(k)类似。
  • yy是因变量
  • uu是自变量
  • vv是扰动项。

特别的,对于最基础的AR模型,可设BB和CC为0,即

A(p)y(k)=0A(p)y(k)=0

A(p)y(k)=y(k)+a1y(k1)+a2y(k2)+...+apy(kp)⇒A(p)y(k)=y(k)+a1y(k−1)+a2y(k−2)+...+apy(k−p)

y(k)=a1y(k1)a2y(k2)...apy(kp)⇒y(k)=−a1y(k−1)−a2y(k−2)−...−apy(k−p)

因而,我们可以实现一个通用的基础模块,并在这个基础模块的基础上不断封装从而实现AR、ARMA、FIR等时间预测模型。

简小派 简小派

简小派是一款AI原生求职工具,通过简历优化、岗位匹配、项目生成、模拟面试与智能投递,全链路提升求职成功率,帮助普通人更快拿到更好的 offer。

简小派 123 查看详情 简小派

代码

基础模块的搭建

显然,自回归模型是一些Linear层的组合。只需要设定各个输入的阶数,在网络中配置对应的Linear层即可。

In [1]
import paddleclass Autoregressive(paddle.nn.Layer):
    def __init__(self, y_features, x_features, e_features):
        # y_features 是一个整数,是因变量的阶数
        # x_features 是一个由整数组成的list,是自变量的阶数,例如有10个自变量,则list的长度为10,每个变量的阶数都可以有所不同
        # e_features 是一个整数,误差的阶数
        super(Autoregressive, self).__init__()

        self.y_features = y_features
        self.x_features = x_features
        self.e_features = e_features        # 构造一个linear_list用于动态构造Linear层
        linear_list = []        if y_features != 0:
            linear_list.append(paddle.nn.Linear(y_features, 1, bias_attr=True))        for _x in x_features:
            linear_list.append(paddle.nn.Linear(_x, 1, bias_attr=True))        if e_features != 0:
            linear_list.append(paddle.nn.Linear(e_features, 1, bias_attr=True))        
        # 将构造好的网络进行组合
        self.linear_list = paddle.nn.Sequential(*linear_list)    def forward(self, *inputs):
        # 自回归模型本质是各个Linear的加法,用0初始化输出变量
        output = paddle.to_tensor([0]).astype('float32')        # 逐个Linear计算
        for i in range(len(self.linear_list)):
            output += self.linear_list[i](inputs[i])            
        return output

如果我们想模拟FIR(Finite Impulse Response)滤波器,只需要对应的设置y_feature = 0,e_features = 0即可。下述代码建立了一个一阶FIR。

In [2]
model = Autoregressive(0, [1], 0)
x = paddle.to_tensor(1,dtype='float32').reshape([1,1])
model(x)
Tensor(shape=[1, 1], dtype=float32, place=Place(cpu), stop_gradient=False,
       [[0.52980936]])

基于Autoregressive构造AR

AR是自回归模型,即仅保留y_features为对应阶数,x_features 设为 [],e_features设为0即可。从用户的角度来说,他们只希望填入y_features,并不像更多的给x_features进行赋值。因而,我们可以进行适当的封装,仅留一个参数给用户输入即可。

In [4]
import paddleclass AR(paddle.nn.Layer):
    def __init__(self, y_features):
        super(AR, self).__init__()
        self.y_features = y_features
        self.Autoregressive = Autoregressive(y_features, [], 0)    def forward(self, *inputs):
        # 只有自回归变量y输入,传入inputs和传入inputs[0]都可以
        output = self.Autoregressive(inputs[0])        return output

这里也可以通过继承父类的方式实现,考虑到后续的扩展,例如预测隐变量(具体怎么使用Paddle做到还没考虑好),这里优先通过模型组网的方式实现。

In [5]
model = AR(5)
paddle.summary(model,(5,5))
----------------------------------------------------------------------------
  Layer (type)       Input Shape          Output Shape         Param #    
============================================================================
    Linear-2           [[5, 5]]              [5, 1]               6       
Autoregressive-2       [[5, 5]]              [5, 1]               0       
============================================================================
Total params: 6
Trainable params: 6
Non-trainable params: 0
----------------------------------------------------------------------------
Input size (MB): 0.00
Forward/backward pass size (MB): 0.00
Params size (MB): 0.00
Estimated Total Size (MB): 0.00
----------------------------------------------------------------------------
{'total_params': 6, 'trainable_params': 6}

模型使用

构造数据读取器

数据使用空气质量数据集。

In [9]
# 读取数据,复现时请到上述链接中下载文件,解压后,将csv文件放在aistudio目录中import pandas as pdimport numpy as np

df = pd.read_csv('AirQualityUCI.csv', sep=';')
df = df.dropna(how = 'all')
y = df.iloc[:,3].to_list()# 对y进行简单预处理,映射为均值为1的序列y = (np.array(y)/np.array(y).mean()).tolist()
In [10]
import paddleclass MyDateset(paddle.io.Dataset):
    def __init__(self, y_list = y, q = 100, mode = 'train'): # q是阶数
        super(MyDateset, self).__init__()

        self.mode = mode
        self.y = y
        self.q = q    def __getitem__(self, index):
        data = self.y[index:index+self.q]
        label = self.y[index + self.q]
        data = paddle.to_tensor(data, dtype='float32').reshape([self.q])
        label = paddle.to_tensor(label, dtype='float32')        return data,label    def __len__(self):
        return len(self.y)-self.qif 1:
    train_dataset=MyDateset(y, 100)

    train_dataloader = paddle.io.DataLoader(
        train_dataset,
        batch_size=16,
        shuffle=True,
        drop_last=False)    for step, data in enumerate(train_dataloader):
        data, label = data        print(step, data.shape, label.shape)        break
0 [16, 100] [16, 1]

模型训练

In [ ]
model = AR(100)
model.train()if 1:    try:        # 接续之前的模型重复训练
        param_dict = paddle.load('./model.pdparams')
        model.load_dict(param_dict)    except:        print('no such model file')

train_dataset=MyDateset(y, 100)
train_dataloader = paddle.io.DataLoader(
    train_dataset,
    batch_size=64,
    shuffle=True,
    drop_last=False)

max_epoch=100scheduler = paddle.optimizer.lr.CosineAnnealingDecay(learning_rate=0.00001, T_max=max_epoch)
opt = paddle.optimizer.Adam(learning_rate=scheduler, parameters=model.parameters())

now_step=0for epoch in range(max_epoch):    for step, data in enumerate(train_dataloader):
        now_step+=1

        img, label = data
        pre = model(img)
        loss = paddle.nn.functional.mse_loss(pre, label).mean()

        loss.backward()
        opt.step()
        opt.clear_gradients()        if now_step%100==0:            print("epoch: {}, batch: {}, loss is: {}".format(epoch, step, loss.mean().numpy()))

paddle.s*e(model.state_dict(), 'model.pdparams')

模型预测

训练好模型后,可以朝后预测。这里给出一个预测100个数据的demo。

In [ ]
data = y[-100:]for i in range(100):
    input_y = data[i:i+100]
    input_y = paddle.to_tensor(input_y).reshape([1,100])
    output_y = model(input_y)
    data.append(output_y.numpy()[0][0])

构造包

参考简书 - 编写 python package 中的 setup.py 文件

如果希望用户能够通过“pip - import”的方式使用编写后的代码,需要进行如下操作:

  1. 建立一个文件夹
  2. 将代码文件都塞到文件夹内
  3. 和文件夹同级目录下编写setup.py文件

本项目的文件夹路径如下

|- PaddleAutoregressive
   |- __init__.py # 留空即可
   |- AR.py # AR的模型声明,需要从Autoregressive.py中import Autoregressive,打包后import路径要从包名开始
   |- Autoregressive.py # 基础模型的声明|-setup.py

setup.py内容如下:

from setuptools import setup, find_packages

setup(    name='PaddleAutoregressive',    packages=find_packages()
)

上传至github后,即可让用户从拉取源码,pip install -e .,import的方式使用写好的代码啦~

从Git Clone开始使用Autoregressive

In [ ]
# 下载代码! git clone https://github.com/Liyulingyue/PaddleAutoregressive.git
%cd ~/PaddleAutoregressive# 安装! pip install -e .
In [ ]
%cd ~import PaddleAutoregressive.AR as ARimport paddle
model = AR.AR(5)
paddle.summary(model,(5,5))

接下来,就可以将AR模型和Paddle模型进行任意组网和训练啦~

以上就是【Autoregressive】从0构造一个基于Paddle的自回归模型库的详细内容,更多请关注其它相关文章!


# git  # ai  # 百度  # csv文件  # python  # 装出  # 怎样修图素材网站推广呢  # 这是  # 益阳网站建设美丽图片  # 郑州网站优化怎么选择  # 包装风格的网站推广  # 网站建设过时了  # 网店推广实训中级seo  # 纪录片网站建设  # 南通正规的网站建设  # 南京seo优化项目  # 智慧推广营销平台简介  # 官网  # 只需要  # 中文网  # 可以通过  # 设为  # 有很多  # 一言  # 是一个  # type  # udio  # pip安装  # yy  # cos 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 2025年贵州省青少年机器人竞赛在安举行  深剖Apple Vision Pro中暗藏的“AI”  全国青少年无人机大赛重庆市选拔赛开赛 1252名中小学生参加  WHEE网页地址入口  7/8上海 | 2025世界人工智能大会分论坛:科技与人文-共筑无障碍智能社会  Moka发布AI原生HR SaaS产品“Moka Eva”,布局AGI时代  WPS AI 官网上线:可申请体验官资格,支持 Windows、安卓端下载  Databricks推出人工智能模型共享机制,可令开发者与公司“双赢”  苹果AI战略与微软谷歌大相径庭,到底是领先还是落后?  鸿蒙OS 4将实现AI大模型集成,余承东表示坚持AI辅助而非AI取代  「从未被制造出的最重要机器」,艾伦·图灵及图灵机那些事  V社回应拒绝上架含 AI 生成内容的游戏:审核政策正在调整中  业内领先 四川大学华西第四医院甲状腺乳腺外科成功进入手术机器人时代  苹果机器学习关键人物 Ali Farhadi 离职,回归 AI2 担任 CEO  人工智能正在弥合认知和表达之间的鸿沟  羊驼家族大模型集体进化!32k上下文追平GPT-4,田渊栋团队出品  拓普龙7188ML:轻便壁挂式工控机箱,为人工智能应用场景提供有力保障  AI+音乐如何“生成”动听旋律?一起揭秘世界人工智能大会开场曲  DreamAvatar数字人使用教程  两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏  WHEE上线时间介绍  微软面向AI初学者推出免费网络课程  AIGC浪潮下,联想集团再加码计算与人工智能  AI数字人业务频频获点赞,谦寻积极引领示范作用  南京制造的国产工业机器人:在外资品牌竞争中突围,年销售1.8万台  CharacterAI - 也许会成为会话人工智能的未来  抖音在Android平台获得VR|直播|软件著作权  消息称苹果 iPhone 15 系列健康应用将深度融合 AI 技术  科技赋能司法执行 阿里资产免费为全国法院升级VR新服务  微软为 AI 初学者推出免费网课:为期 12 周,共 24 节课  百度文心一言App上架苹果商店,人工智能创作引发热议  给小朋友最好的科技礼物:乐天派桌面机器人  再也不怕「视频会议」尬住了!谷歌CHI顶会发布新神器Visual Captions:让图片做你的字幕助手  大疆 Air 3 无人机售价和实物照片曝光  常见的五个人工智能误解  Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽  V社悄悄封禁使用AI生成美术素材的游戏  中国移动主导创立元宇宙产业联盟,包括科大讯飞、芒果TV等在内,共24家成员  讯飞听见会写“会议摘要”功能全面升级,AI更懂你的关注点  ​布局智能物联新时代,中国移动“5G+物联网”亮相2025 MWC  人工智能改变网络安全和用户体验的三种方式  对艺术家拒绝置若罔闻,Stability AI 将推出适应多种画风的开源模型  闪电快讯|京东推出言犀AI大模型 面向零售、医疗、物流等产业场景  马斯克发推讽刺人工智能:机器学习的本质就是统计  Win11 的画图应用将包含 Windows Copilot 的 AI 工具整合  DeepMind推惊世排序算法,C++库忙更新!  Yann LeCun团队新研究成果:对自监督学习逆向工程,原来聚类是这样实现的  无人机协助盐城交通执法的协同训练  人工智能大胆预测:银河系至少有2万个地球,36种外星文明  如何用Transformer BEV克服自动驾驶的极端情况? 

 2025-07-16

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.