幽灵学院

MySQL Cluster支撑领先文件管理Web服务

2019-04-12 20:33 来源:网络整理 编辑:幽灵学院  人气:   评论一下

        Docudesk简介

  成立于2001年,总部在达拉斯、德克萨斯州,Docudesk是一家领先的PDF文件软件开发商,创建以提供价廉优质创新的PDF软件为目标。

  在看到过去几年里Docudesk拥有成千上万的客户需求之后,很显然,客户创建PDF的主要原因是创建一个最终需要与用户共享的专业的安全的文件。但是客户会花时间手工制作PDF文件,然后仅仅是为了打印和传真或通过快递服务将其发送出去,因此完全失去了PDF最开始的功能,并且会这也扩大了它们不必要的销售周期、合同审批、贷款协议和保险索赔。

MySQL Cluster支撑领先文件管理Web服务

  为了解决这些问题,Docudesk开发了DocO web服务以消除共享物理文件的限制。DocO是一个完全的无纸传输的商业方案,提供一个独立的空间让客户能够管理、获取和发送他们重要的文件。通过设计,DocO创建以不仅支持安全商业交易,而且还提供需要存储、编辑、协作和发布商业文件的支持设施。具体来说,DocO服务被设计用于交付:

  • 客户通过一个轻松简便的方式获得合法签署的文件,不需要打印、传真和通宵快递传送。

  • 提供的"onramp"技术可以促进从一个物理文件到数字文件的过渡,使得扫描和传真使用情况下可以很容易的与DocO一起工作。

  • 提供一个丰富的互联网应用,该应用给DocO客户一个没有软件和硬件配置要求的解决方案,并且这比一台传真机更容易。

  • 通过尊重文件的质量、可移植性和安全性来保护PDF文件的内容。

  • 提供一个无与伦比的信任度和简便性。

  • 提供互补的工具和特性,这使得企业使用DocO获得所有无纸化传输的努力包括:移动接入、文件获取、形式响应、扫描一体化和文件出版。

  • 设计一个满足或超过相关标准的系统:包括1999 e-Sign行动和UETA(电子交易网)。

  业务需求

  作为一个全新的服务,对于可以支撑DocO应用的系统架构,Docudesk在技术选择上拥有很大的灵活性。该灵活性扩展到支持具有以下属性的应用的数据库中:

  • 支持数据库上高容量的写吞吐量的能力,其中这些工作预计代表50%的业务工作量。

  • 保证延迟和响应时间都很低,以支持用户期望的实时的、交互式的体验服务。

  • 为了满足用户可用性需求,保证至少99.999%的正常运行时间。

  • 随着服务增长而线性扩展,与此同时,减少设计和部署的成本和复杂度。

  文件通过DocO应用来管理并存储在Amazon S3云基础存储服务上,文件元数据和文本从实际的网页提取到XML上并存储在数据库中。文件访问是通过DocQ Access Control Lists (ACLs)和Amazon's S3 ACL控制,通过数据库运维。

  用户会话状态在数据库中缓存以允许服务个性化,并且可以在用户表格里存储更久,而表内的老数据会被定期清除。

  由于DocQ最初被设计作为文件交易服务,DocO需要一个能实现毫秒级时间戳的文件标识符的实时的架构。“我们发现MySQL Cluster能够满足该要求时我们非常激动”,Docudesk的DBA兼研发经理Casey Brown说。

  MySQL Cluste解决方案

  在过去,Docudesk使用MySQL来支持其内部一些操作系统,并且起初是打算使用MySQL服务器,通过InnoDB存储引擎配置一个主/主共享来处理DocQ服务的写吞吐量需求。他们也打算在MySQL服务器前面部署memcached以减少数据库压力并保证用户读访问的低延迟。然而,Docudesk架构有关该类解决方案需要关注的复杂度水平,并且决定探讨其他选择。

  “对于我们的要求99.999%运行时间的更新密集的web服务来说,MySQL和memcached解决方案将会太复杂。“我们发现MySQL Cluster在一个解决方案中,能给我们以低延迟、马上就可以使用的扩展我们web服务的能力”,Docudesk的DBA兼研发经理Casey Brown说。

 MySQL Cluste解决方案

  通过调查,Docudesk发现一篇学术论文这样描述MySQL Cluster数据库:它提供了人们所需要的低延迟、写密集支持,通过一个需要交付99.999%的正常运行时间的完全冗余架构来实现。所有这些功能作为标准产品供应的一部分是可用的,因此消除了必须整合多个组件到一个数据库管理平台的复杂性。

  由于它的开源许可性,Docudesk能够免费下载、评估和部署MySQL Cluster来支撑DocO服务,这都不需要支付许可证和支持费用。

  自从2008年该架构支撑的DocO应用已经存放在Amazon EC2和S3云平台上,提供Docudesk可以按需扩展。目前,MySQL Cluster管理4GB数据,该数据每天增长1-2%,在内存和磁盘之间分割表格。MySQL Cluster配置包括两个数据节点和两个管理节点用来冗余,以及六个MySQL服务器应用节点提供SQL访问数据,每天平均处理50万到100万的查询。基于磁盘的表格和Global Check Points (GCPs)存储在Amazon Elastic Block Storage上。

  文件的文本页面作为BLOBs (Binary Large Objects)存储在MySQL Cluster表格中,允许快速文本字符串搜索。

  除了存储文件元数据和文本页面、PHP数据和ACLs之外,MySQL Cluster也负责以下:

  • 运维工作查询系统(Amazon自己的系统不会保证服务要求的低水平的延迟和坚固性。

  • 升级和记录所有操作使得文件(例如编辑、注释、数字签名等)可以使用DocO计费系统。

  未来与MySQL的合作

  Docudesk打算部署MySQL Cluster 7.1来充分利用最新版本提供的增强的功能优势。为了不影响客户端服务,进而在线扩展数据的能力和性能,他们也测试了添加数据节点来运行Cluster。Docudesk也对“push down joins”工程感兴趣,该工程如果加入到未来版本的MySQL Cluster中,将会有潜在改进多表连接的能力。

  Docudesk MySQL Cluster解决方案概览

  • DocO web 服务是一个无纸化传输的商业解决方案,提供一个独特的知识库给客户管理、获取和发送他们重要的文件。

  • 数据库需要保证服务需要的高水平的写吞吐量、低延迟响应和持续可用性。

  • 由于整合和管理的复杂性,一个共享的、多主加上memcached MySQL解决方案被否定了。

  • MySQL Cluster平均每天处理内存和磁盘表格的100万个查询,并且每天增长2%。

  • MySQL Cluster处理文件元数据和文本、PHP状态、ACLs、工作查询和文件计费操作。

  MySQL Cluster--实时的关键任务应用的领先的开源、高可用数据库

  MySQL Cluster是行业中唯一的真正的实时数据库,它结合了一个高可用关系型数据库的灵活性和开源低成本特性。

  电信级别的可用性

  MySQL Cluster的无共享分布式架构、不会出现单点故障、保证99.999%的可用性的特性,可以满足您最苛刻的关键业务应用要求。

  高吞吐量和低延迟

  MySQL Cluster的实时性设计保证了一致性、毫秒响应时间、每秒处理成千上万的事务的能力。

  线性扩展

  支持磁盘上的数据,自动数据分区实现负载均衡,可以零宕机的在一个正在运行的Cluster上添加节点,并允许几乎无限制的扩展数据库来处理最不预测的基于web的工作量。

未来与MySQL的合作

  MySQL Cluster架构已设计能达到99.999%的可用性并能实现大量读/写扩展

未来与MySQL的合作

 

          版权声明:

[提醒] 除特别声明外,该内容由( )发布,转载请保留文章出处!
  •  我顶 
  • 点击
  • 收藏