首页 创业投资正文

「IT技术」如何用Quarto从R或Python创建Word文档

小业 创业投资 2023-02-28 03:33:05 6316 0 ctoQuarto文档可以Word

有几种方法可以从编程语言中创建Word文档,包括R Markdown和带有R的officer包以及Python中的Python -docx库。但最新的、更有趣的是Quarto,它是RStudio(现在是Posit)提供的免费、开源技术发布系统,是Python、Julia和R的原生版本。

Quarto的最大优势之一是,与特定于Word的包不同,经过一些小调整的相同Quarto文件可以用于生成除Word之外的数十种输出格式,包括PowerPoint、HTML和PDF。(了解更多:“什么是Quarto?”RStudio推出下一代R Markdown”。)此外,您还可以自动创建Word报告,并包括分析结果和可视化代码。

下面是如何使用Quarto创建Word文档。

步骤1:安装Quarto

因为Quarto不是特定于语言的库,所以可以像安装其他独立软件一样安装它。你可以在Quarto的“Get Started”页面上找到Windows、macOS和Linux的二进制下载。

如果您是R用户,并且拥有最新版本的RStudio,那么默认情况下应该包含Quarto。您不需要单独安装Quarto。

如果您想在Visual Studio Code中使用Quarto,除了安装Quarto应用软件外,还需要安装Quarto扩展。为了呈现包含Python代码的Quarto文档,我的系统还指示我通过运行python3 -m pip install Jupyter来安装Jupyter Notebook。

您可以使用任何纯文本编辑器和终端创建和呈现Quarto文件,就像使用R或Python脚本一样,因为它们是纯文本而不是二进制文件。但是,您将错过IDE的所有内置工具,例如代码完成建议和呈现按钮。

步骤2:创建一个Quarto文档文件

一旦你安装了Quarto,你可以用通常的方式在你的IDE中创建一个新的Quarto文件,要么在RStudio中创建>新文件>四Quarto文档(不是四Quarto Presentation),要么在VS Code中创建>新文件,并选择“Quarto”作为语言。

展开全文

在RStudio中,您可以选择几种Quarto文档输出格式。选择Word,然后可以自动生成Word示例文档或空白文档。在您熟悉Quarto语法之前,看看示例是什么样子是很有帮助的。

「IT技术」如何用Quarto从R或Python创建Word文档

在RStudio中,您可以选择几种Quarto文档输出格式。选择Word,然后可以自动生成Word示例文档或空白文档

在RStudio中,您可以选择几种Quarto文档输出格式。选择Word,然后可以自动生成Word示例文档或空白文档。在您熟悉Quarto语法之前,看看示例是什么样子是很有帮助的。

RStudio在选择Word输出时生成的示例四开本文档。

RStudio中默认的YAML头包括标题、输出格式(在本例中为Word的docx)和编辑器(可视所见即所得或源代码)。

如果你在VS Code中从一个空白文档开始,你可以在顶部添加基本的YAML头:

title: “Your document title”

format: docx

据我所知,在VS Code中没有WYSIWYG四分之一编辑器,所以没有理由指定一个编辑器。

然后开始创建你的内容。

步骤3:使用Markdown语法添加文本

Quarto使用Pandoc版本的Markdown语法来编写文本。这包括在你想要用斜体显示的文本周围加一个下划线,在你想要加粗的文本上加两个星号,在段落之间加空行,在一行末尾加两个或多个空格来创建换行符,在一行开头加散列符号来表示标题字体大小。一个散列表示最大的字体大小,h1;2是第二大的,h2;等等。

第4步(可选):根据引用.docx为文档设置样式

一些为Quarto HTML输出格式设计的基于css的文档样式在导出到Word时将无法工作。但是,您可以为您的文档创建一个单独的参考样式Word文档,其中包含字体样式、大小等。

下面的代码应该在你的终端(不是R或Python控制台)中运行,以创建一个默认的Word样式文档,在这个例子中称为my_doc_style.docx(你可以叫它任何名字):

quarto pandoc -o my-doc-style.docx \

—print–default-data-file reference.docx

这将创建一个常规的Word .docx文件,而不是Microsoft Word .dotx模板。您可以打开您的引用.docx,并通过从Word功能区打开样式面板来自定义它的样式,就像对任何Word文档一样。

要在Quarto文档中使用模板,请使用如下语法将其添加到文档的YAML头文件中:

format:

docx:

reference-doc: my-doc-style.docx

对于Quarto Word文档,还可以使用其他自定义功能,例如添加目录或节编号,这些可以在Quarto Word文档中看到。

步骤5:将R或Python代码的结果添加到Word文档中

从R或Python生成Word文档的最佳功能之一是能够运行代码并将结果添加到文档中(包括图形)。

你可以通过在你的Quarto文件中添加代码块来做到这一点,这些代码块由三个反引号来设置,就像R:

“`{r}

# R code here

或者Python是这样的:

“`{python}

# Python code here

您可以为代码块设置选项,例如是否显示代码(echo)、运行代码(eval)、显示代码警告消息,等等。对于R、Python或Julia,块选项以#|(通常称为“散列管道”)开始。

下面的chunk选项将在一个chunk中显示R代码的结果,但不显示Word文档中的代码:

“`{r}

#| echo: false

#| eval: true

# R code here

其他选项包括#| fig-cap:我的图标题,#| warning: false表示在代码运行时不显示任何警告消息,#| cache: true表示缓存计算密集型块的结果,其中数据不会改变。

可以使用!expr执行图标题选项中的代码,其语法为

#| fig-cap: !expr paste(“Data pulled on”Sys.Date())

步骤6:渲染文档

你可以在RStudio或VS Code中使用渲染按钮,键盘快捷键Ctrl/Cmd + Shift + K或终端命令来渲染一个Quarto文档

quarto render my_quarto_document.qmd –to docx

对于名为my_quarto_document的文档。

R用户也可以使用quarto R包的命令

quarto_render(“my_quarto_document”)

注意:在早期版本中,RStudio弹出的初始Word文档预览有时并不总是显示我的图形。这似乎已经解决了。但是,如果您遇到这种情况,请尝试将初始的.docx文件复制为一个新的、可编辑的Word文档,因为这为我解决了这个问题。

步骤7(可选):用参数自动化多个版本

能够使用代码的结果创建Word文件不仅对一次性文档有用。它还允许您通过从外部数据源提取新数据、运行新计算并通过单个渲染调用生成最新图形的代码简化常规数据报告和更新。

但是Quarto还能够向报表添加参数,这些参数类似于呈现期间在外部定义的变量。这样您就可以使用报表作为模板,并为不同的参数(如城市或地区)创建相同的报表。例如,如果您需要为10个城市中的每一个运行一个报告,那么city可以定义为文档YAML头中的一个参数,例如华东CIO大会、华东CIO联盟、CDLC中国数字化灯塔大会、CXO数字化研学之旅、数字化江湖-讲武堂,数字化江湖-大侠传、数字化江湖-论剑、CXO系列管理论坛(陆家嘴CXO管理论坛、宁波东钱湖CXO管理论坛等)、数字化转型网,走进灯塔工厂系列、ECIO大会等

title: “My Quarto Document”params:

city: New York—

这将设置一个名为city的参数,其默认值为New York。然后,您可以在R代码中使用params$city访问city参数的值,例如

“`{r}

#| echo: false

cat(“This report is about”, params$city)

为了在R中使用相同的Quarto文档创建多个报告,但参数值不同,我通常创建一个函数来呈现我的文档,然后使用purrr包的walk()函数在一列项上运行我的函数。例如,如果参数化的Quarto文档名为params_test。qmd有一个名为city的参数,这可以是我在R中的渲染函数:

render_my_doc <- function(the_city = “New York”, the_doc = “params_test.qmd”) {

quarto::quarto_render(input = the_doc, execute_params = list(“city” = the_city),

output_file = paste0(“test_”, the_city, “.docx”), output_format = “docx”)

下面是我如何使用函数为纽约、芝加哥和洛杉矶生成三个单独的文档:

library(purrr)

walk(list(“New York”, “Chicago”, “Los Angeles”), render_my_doc)

Python语法略有不同,它基于造纸厂库。例如,在Python代码块中定义参数,如下所示

“`{python}

#| tags: [parameters]

city = ‘Boston’

你可以在Quarto Parameters文档中阅读更多关于Python文档参数化的信息。

原文:

There are several ways to create a Word document from programming languages, including R Markdown and the officer package with R and the python-docx library in Python. But one of the newest and more intriguing is Quarto, a free, open source technical publishing system from RStudio (now Posit) that’s native to Python and Julia as well as R.

One of the big advantages of Quarto is that, unlike a Word-specific package, the same Quarto file with minor tweaks can be used to generate dozens of output formats in addition to Word, including PowerPoint, HTML, and PDF. (Find out more: “What is Quarto? RStudio rolls out next-generation R Markdown”.) In addition, you can automate the creation of Word reports and include results of your analysis and visualization code.

Here’s how to use Quarto to create Word documents.

Step 1: Install Quarto

Because Quarto isn’t a language-specific library, you install it like any other stand-alone software. You can find binary downloads for Windows, macOS, and Linux on Quarto’s “Get Started” page.

If you’re an R user and you have an up-to-date version of RStudio, Quarto should be included by default. You don’t need to install Quarto separately.

If you want to use Quarto in Visual Studio Code, install the Quarto extension in addition to the Quarto application software. To render Quarto documents that include Python code, my system also instructed me to install Jupyter Notebook by running python3 -m pip install jupyter.

You can create and render Quarto files with any plain text editor and your terminal, just as you can with R or Python scripts, since they are plain text and not binary files. However, you’d miss out on all of the built-in tools of an IDE, such as code completion suggestions and a render button.

Step 2: Create a Quarto document file

Once you’ve got Quarto installed, you can create a new Quarto file in your IDE the usual way, either File > New File > Quarto Document (not Quarto Presentation) in RStudio, or File > New File in VS Code and choose “Quarto” as the language.

In RStudio, you’ll have a choice of a few Quarto document output formats. Select Word, and you can then either auto-generate a Word sample document or a blank doc. It can be helpful until you’re familiar with Quarto syntax to see what the sample looks like.

CXO联盟(CXO union)是一家聚焦于CIO,CDO,cto,ciso,cfo,coo,chro,cpo,ceo等人群的平台组织,其中在CIO会议领域的领头羊,目前举办了大量的CIO大会、CIO论坛、CIO活动、CIO会议、CIO峰会、CIO会展。如华东CIO会议、华南cio会议、华北cio会议、中国cio会议、西部CIO会议。在这里,你可以参加大量的IT大会、IT行业会议、IT行业论坛、IT行业会展、数字化论坛、数字化转型论坛,在这里你可以认识很多的首席信息官、首席数字官、首席财务官、首席技术官、首席人力资源官、首席运营官、首席执行官、IT总监、财务总监、信息总监、运营总监、采购总监、供应链总监。

数字化转型网(资讯媒体,是企业数字化转型的必读参考,在这里你可以学习大量的知识,如财务数字化转型、供应链数字化转型、运营数字化转型、生产数字化转型、人力资源数字化转型、市场营销数字化转型。通过关注我们的公众号,你就知道如何实现企业数字化转型?数字化转型如何做?

【联盟会员】百大CTO、星湖CTO、通化东宝CTO、梅雁吉祥CTO、远东CTO、厦华CTO、石化油服CTO、中炬高新CTO、梅花CTO、创业CTO、东方CTO、洛阳玻璃CTO、电能CTO、航天CTO、博瑞传播CTO、亚泰CTO、妙可蓝多CTO、博闻CTO、杉杉CTO、宏发CTO、国投CTO、伊利CTO、新疆众和CTO、南京化纤CTO、中房CTO、大晟CTO、航发动力CTO、广日CTO、张江CTO、海医CTO、厦门空港CTO、美讯CTO、长江CTO、江苏租赁CTO、贵州燃气CTO、三峡CTO、财达证券CTO、无锡银行CTO、华安证券CTO、黄金CTO、重庆燃气CTO、中泰证券CTO、江苏银行CTO、杭州银行CTO、西安银行CTO、雪天盐业CTO、爱柯迪CTO、广西广电CTO、重庆建工CTO、维远CTO、新天绿能CTO、东方证券CTO、江苏有线CTO、渤海CTO、株冶CTO、国投中鲁CTO、岳阳林纸CTO、福成CTO、博汇纸业CTO、内蒙一机CTO、海油CTO、郴电CTO、中材CTO、恒源煤电CTO、宝胜CTO、新五丰CTO、健民CTO、电影CTO、广安爱众CTO、北矿CTO、汇鸿CTO、宁波CTO、惠而浦CTO、建设机械CTO、淮北矿业CTO、浙文互联CTO、航民CTO、赤峰黄金CTO、宝丰CTO、四创CTO、贵绳CTO、马应龙CTO、文山CTO、贵广CTO、开滦CTO、九州通CTO、招商证券CTO、唐山港CTO、晋控煤业CTO、晋亿CTO、柳钢CTO、重庆钢铁CTO、大秦铁路CTO、金陵饭店CTO、连云港CTO、南京银行CTO、文峰CTO、宝泰隆CTO、隆基CTO、陕西黑猫CTO、节能风电CTO、宁波港CTO、山东出版CTO、华钰CTO、春秋航空CTO、玉龙CTO、一拖CTO、赛轮轮胎CTO、中信建投CTO、中铝CTO、西部黄金CTO、渝农商行CTO、国芳CTO、神华CTO、中南CTO

免责声明

本文仅代表作者观点,不代表本站立场,著作权归作者所有;作者投稿可能会经本站编辑修改或补充;本网站为服务于中国中小企业的公益性网站,部分文章来源于网络,百业信息网发布此文仅为传递信息,不代表百业信息网赞同其观点,不对内容真实性负责,仅供用户参考之用,不构成任何投资、使用建议。请读者自行核实真实性,以及可能存在的风险,任何后果均由读者自行承担。如广大用户朋友,发现稿件存在不实报道,欢迎读者反馈、纠正、举报问题;如有侵权,请反馈联系删除。(反馈入口)

本文链接:https://www.byxxw.com/zixun/30080.html