how to do? createStyle location the data frame to write df <- res_after_filter_2019_smiles Create a new workbook wb <- createWorkbook("hello_excel") Add a worksheets addWorksheet(wb, "sheet01", gridLines = FALSE) write data to worksheet 1 writeData(wb, sheet = 1, df, rowNames = FALSE) create and add a style to the column headers headerStyle <- createStyle( fontSize = 12, fontColour = "#FFFFFF", halign = "center", fgFill = "#4F81BD", border = "TopBottom", borderColour = "#4F81BD" ) addStyle( wb, sheet = 1, headerStyle, rows = 1, cols = 1:ncol(df), gridExpand = TRUE ) style for body bodyStyle <- createStyle(border = "TopBottom", borderColour = "#4F81BD", fgFill = "#CDEDD0") row_to_color <- df %>% tibble::rowid_to_column(.

Continue reading

简单拟合一个线性模型 states <- as.data.frame(state.x77[,c("Murder", "Population", "Illiteracy", "Income", "Frost")]) fit <- lm(Murder ~ Population + Illiteracy + Income + Frost, data=states) #summary(fit) 线性模型假设的综合验证 使用gvlma包中的gvlma函数验证模型的线性假设。gvlma函数由Pena和Slate ( 2006 )编写,能对线性模型假设进行综合验证,同时还能做偏斜度、峰度和异方差性的评价。换句话说,它给模型假设提供了一个单独的综合检验(通过/不通过)。 # Listing 8.8 - Global test of linear model assumptions library(gvlma) gvmodel <- gvlma(fit) summary(gvmodel) ## ## Call: ## lm(formula = Murder ~ Population + Illiteracy + Income + Frost, ## data = states) ## ## Residuals: ## Min 1Q Median 3Q Max ## -4.

Continue reading

记得吗?读书时候,我们只崇拜和欣赏无需努力或者看上去不怎么需要努力,就取得好成绩的同学。不够聪明的人才需要全力以赴,聪明的人都轻松上阵。 这个由固定型思维衍生和推导出来的观点有多致命?这个观点让固定型思维模式者不愿意努力了。许多人认为需要大量努力是能力低下的表现 ,他们不愿意自己看起来能力低下。如果他们不努力,他们至少可以找到一个借口:我之所以失败了,我之所以表现不佳,是因为我压根没尽力。努力了,仍然失败了,是固定型思维模式者更大的恐惧。可是努力后的失败,才是诚实的失败。 两种思维模式的人,想法和行为有太多不同: 对待挑战,固定型思维模式者只对他们一开始就做得很好的事情,保持兴趣,当开始感到困难的时候,获得的乐趣就骤减,如果这件事不能证明他们有多聪明,他们就无法对其感兴趣,但是呢,成长性思维的人,越有挑战,他就越来劲,越感兴趣,越沉浸其中。固定思维的人不想接受挑战,他们因此错过许多机会,成长思维的人喜欢挑战,即使刚开始磕磕绊绊,但他们会越来越好。关注优胜,会很容易焦虑,但是如果关心的是成长,心态会发生巨大的改变。

Continue reading

蝇王

You Become A Monster, You Will Not Be Scare A Monster 一群孩子被放到隔绝外界环境的孤岛, (这样的设定有点像实验术语中的控制变量. 作者想要证明人性本恶, 与外界无关, 也就是和其他变量没有关系.) 天真的孩子是如何从文明走向罪恶的过程, 完美的推演了由善像恶的自发过程. 表明人性本恶, 恶就存在人的身体里, 天生就带着恶的属性. 总结起来需要三个自带的条件: 共同的敌人 迫切的基础需求 主流的裹挟(集体无意思)

Continue reading

某个宁静的下午, 我带着一个急需解决的问题或者困惑去 Google Scholar 上查阅文献, 但是我在阅读过程中不断点击正在阅读的论文的参考文献链接, 然后继续阅读这些文章的引用论文, 无休无止, 很快我发现我想了解的这个问题所在领域是一个深不可测的海洋, 需要用一生去研究才可能有所作为, 因此很快我变得不知所措, 对阅读论文这件事感到无比焦虑、惶恐, 那么你在做研究时是否碰到类似的问题, 又有什么办法应对这种感觉呢? 所以“如何高效阅读论文”对于刚入门的研究人员来说, 是一个永恒的问题 数学 数学是一篇文献的基本要素之一, 并且是有限的, 学会如何拆解他, 并理解和解释, 这些东西是不变的. 综述 阅读综述: 在40-60页的综述文章中, 你通常能够以一种优美、整洁、结构化、条理清晰的方式获取100-200篇论文中的重要信息。 当你阅读了2-3篇最近(过去5年内)的综述论文后, 你会发现三点: 总是被引用的论文; 其具体工作听起来很酷或很相关的作者; 你感兴趣的子领域中相对较新的进展, 以及关于这些主题的值得注意的论文。 一旦有了这三点, 那么你就很清楚接下来该读什么, 为什么读, 以及读的顺序了。 略读 最重要的是, 你要回答一个具体的问题。提出这样一个问题, 可以帮助你在一分钟内确定这篇论文是否包含答案。 至少以粗略的方式阅读各种论文是件好事, 因为即使你不了解如何实现这些论文, 你也会知道有这样的方法/想法存在 , 并且当有机会或当它与你的研究相关性很大时, 你可以回过头来深入阅读。将这些论文视为工具箱中的可能有用的工具就行。头脑里的关键字积累是很重要的. 如果你能在5分钟内意识到一篇论文可能不是你现在需要学习的东西, 漂亮!这样你只浪费了5分钟的时间就可以进行下一步操作了。 精读 随手列出问题清单, 一定要抵制立即查找你遇到的不理解内容的冲动! 并在获得答案时写下答案, 仅在读完论文之后, 才去查阅里面的知识点 再怎么强调都不为过的是: 一定要确保你在阅读的同时进行输出. 哪怕只是在白纸上写写画画。只要确保将相关的思想联系在一起, 并跟踪这些思想的准确引用即可。对关键概念做一点文献笔记很有必要, 当你为了找到一个准确的引用需要回顾1-3年前读过的论文时, 你会发现将两个关键思想联系在一起很有帮助。 慢慢地, 随着你的进步, 你将开始了解更多, 并且由于你已经积累了框架, 很多让你早期感觉困惑的知识点开始变得不言而喻。对于我来说, 很多时候我会浏览论文中的公式。因为人们的写作风格和某些单词背后的含义含糊不清, 但是公式是清晰的。

Continue reading

Difference between multi-class classification & multi-label classification is that in multi-class problems the classes are mutually exclusive, whereas for multi-label problems each label represents a different classification task, but the tasks are somehow related. multi-class classification makes the assumption that each sample is assigned to one and only one label: a fruit can be either an apple or a pear but not both at the same time.

Continue reading

确定致病机制 1. 皇后确诊乳腺癌 2. 药物遍寻均无效 3. 精准医疗项目启动 生物信息分析 特异化突变基因鉴定 蛋白通路与疾病关联性 XYZ蛋白三维晶体结构 XYZ蛋白药物结合口袋突变前后分析 先导化合物 1. 计算机辅助药物设计: 在 蛋白质三维结构基础上,彻底分析突变后XYZ蛋白结合口袋周围理化性质 突变前:小分子包围在疏水口袋,亲水氨基酸R125、E154与其形成氢键铆钉作用,使其牢牢稳固在蛋白质中 突变后:疏水环境大致不变,但氨基酸N125、I154(无法形成氢键)造成很大空隙,亲水性转换为疏水口袋,稳定性降低 2. 分子动力学方法 分子动力学方法对XYZ蛋白突变后与小分子Hormone间相互作用状况进行了计算模拟分析, 目的:以期得到蛋白质在突变后的小分子结合信息 计算中心首席科学家是这么解释分析结果的: 突变后XYZ蛋白Region A区域没有变化,对该部分不做任何修改; Region B区域中,小分子下方出现巨大空洞,需要对该部分进行补漏; Region B区域巨大空袭,在小分子稳定结合时,下方出现由10~13个水分子组成的“水氢键网络体系”; “水氢键网络体系”中,水分子能量Energy(球体大小)和占有率Occupancy(球体颜色)均能表达出蛋白质局部区域理化性质。 > 具体总结:Region B区域绝大多数水分子能量Energy极小、占有率Occupancy较小,说明该区域极为疏水;但其中W1水分子,能量较好、占有率较高,说明W1水分子极为稳定,周围氨基酸为极亲水性氨基酸,将来可以通过替换W1水分子或通过桥键作用对其进行化学修饰 ; ; 3. 基于体内原生激素Hormone的药物设计:化学片段增长设计法 首先设计的化学片段,将能够有效的到达W1水分子附近或将其替换掉, 福斯坦国立大学化学院研究团队,共设计母核结构50枚,且均具备有机合成实验方法实现的可能性 ; ; 4. 分子对接方法判定最佳化学母核结构 利用分子对接方法,将50枚母核结构分别对接进入突变后蛋白质XYZ结构中, 利用分子对接权重值, 判定3枚小分子药物在对接结果中占据较好的权重位置。奥古斯汀·Khan将此结果呈现给,福斯坦国立大学化学院研究团队,经过再三斟酌分析,决定采用C2、C1和C3进行后期化学结构改造 5.

Continue reading

Author's picture

Jixing Liu

Reading And Writing

Data Scientist

China